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(§) MECANISMES DE RESISTANCE AUX BACTERIOPHAGES R/M DE TYPE IC DE BACTERIES LACTIQUES 



L'invention est relative a des polypeptides constituant 
des sous-unites d'un mecanisme de resistance aux bacte- 
riophages R/ M de type lc, actif contre les phages des bac- 
teries lactiques, et aux sequences d'acide nuclelque codant 
pources polypeptides. 

- - ^expression de ees polypeptides dans une bacterie lac-^ 
tique permet d'augmenter sa resistance aux attaques des 
bacteriophages. 
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MECANISMES DE RESISTANCE AUX BACTERIOPHAGES R/M DE TYPE Ic DE 

BACTERIES LACTIQUES . 

L 1 Invention est relative a des systemes cle 
resistance aux bacteriophages R/M de type Ic actifs sur les 
5 bacteriophages des bacteries lactiques. 

L'obtention de bacteries lactiques resistantes a 
l'attaque par les bacteriophages, est d'un grand interet dans 
le domaine des fermentations industrielles . 

Dans ce but, il est generalement propose : 
10 - soit de selectionner des mutants, naturels ou 

obtenus par mutagenese, resistants aux bacteriophages ; 

- soit d'utiliser des vecteurs portant des genes 
codant pour des mecanismes de resistance aux phages pour 
transferer ceux-ci chez des souches initialement non- 
15 resistantes. 

Les mecanismes de resistance aux phages sont 
regroupes en 3 classes principales, selon I'etape du cycle de 
reproduction des bacteriophages avec laquelle ils 
interferent : 

20 - les mecanismes regroupes sous la denomination 

"mecanismes d' interference avec 1 1 adsorption", retardent 

l 1 adsorption du phage sur la bacterie ; 

les mecanismes denommes "mecanismes 

d* infection abortive" (Abi), bloquent la multiplication des 
25 phages, et provoquent la mort de la bacterie infectee avant 

que celle-ci ne produise des particules virales capables 

d' inf ecter d'autres cellules ; 

les mecanismes denommes "mecanismes de 

restriction/modification" (R/M), degradent 1 1 ADN du phage des 
30 son entree dans la bacterie. Ces mecanismes associent une 

endonuclease de restriction, et une methylase, qui a pour 

fonction de proteger le genome bacterien, en modifiant les 

sequences de celui-ci qui pourraient constituer des sequences 

cible de 1' endonuclease . 
35 3 types principaux de mecanismes R/M (types I, 

II, et III) ont ete decrits [pour revue, cf. par exemple 

BICKLE et KRUGER, Microbiological Reviews, 57, pp. 434-450 
(1993)]. Les caracteristiques des mecanismes R/M des types I 

et II sont brievement rappelees ci-apres : 
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Les mecanismes R/M de type II sont les plus 
frequents ; ils sont constitues de deux enzymes distinctes, 
une methylase et une endonuclease, qui sont actives 
separement , et qui reconnaissent une sequence-cible commune . 

Les mecanismes R/M de type I ont ete 
principalement decouverts chez des enterobacteries, puis ont 
egalement ete mis en evidence chez quelques bacteries Gram* 
(Bacillus subtilis, et Mycobacterium pulmonis) , et chez des 
archaebacteries . 

Dans ces mecanismes, la methylase (sous-unite M, 
ou HsdM) et 1' endonuclease (sous-unite R, ou HsdR) forment 
chacune une sous-unite d'un complexe enzymatique 
multif onctionnel ou elles sont associees avec une troisieme 
proteine (sous-unite S, ou HsdS), qui est responsable de la 
reconnaissance de sequences specifiques par le complexe 
enzymatique . 

Ces trois proteines sont les produits de genes 
respect ivement denommes hsdM, hsdR et hsdS. Des 
experimentations de complementation genet ique, et la 
comparaison des sequences de ces genes ont permis de repartir 
les mecanismes R/M de type I en 4 families distinctes n'ayant 
qu' une tres faible homologie entre elles : la, lb, Ic, et Id. 

D' autre part, il a ete observe que les mecanismes 
R/M de type I pouvaient acquerir une nouvelle specificite a 
la suite de recombinaisons dans le gene hsdS [FULLER-PACE et 
MURRAY, Proc. Natl. Acad. Sci . USA, 83, pp. 9368-9372, 
(1986) ; SHARP et al., Proc. Natl. Acad. Sci. USA, 89, pp. 
9836-9840 (1992) ; GUBLER et al. EMBO J., 11 pp ._J!33-240, 
11992)77 

Les mecanismes R/M caracterises jusqu'a present 
chez les bacteries lactiques, et dont 1' utilisation a ete 
proposee pour rendre celles-ci plus resistantes aux 
bacteriophages sont des mecanismes R/M de type II [FITZGERALD 
et al. Nucleic Acids Research, 10, pp. 8171-8179, (1982) ; 
NYENGAARD et al., Gene, 136, pp. 371-372 (1993) ; TOWNEY et 
al. Gene, 136, pp. 205-209, (1993) ; DAVIS et al., Appl. 
Environ. Microbiol., 59, pp. 777-785, (1995) ; NYENGAARD et 
al., Gene, 157, pp. 13-18 (1995) ; 0' SULLIVAN et al . , J. 
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Bacterid., 177, pp. 134-143 (1995) ; MOINEAU et al., Appl. 
Environ. Microbiol., 61, pp. 2193-2202, (1995)]. 

Un des inconvenients principaux de 1' utilisation 
de ce type de mecanismes est 1' apparition de phages 
5 resistants, due en particulier au fait que la methylase du 
systeme R/M reconnait et modifie une certaine proportion des 
molecules de 1'ADN des phages, qui peuvent ensuite echapper a 
1' action de 1' endonuclease . Ce phenomene apparait en 
particulier lors d' utilisation prolongee en conditions de 

10 fermentation industrielle. Pour le limiter, il a ete propose 
d'associer plusieurs mecanismes R/M reconnaissant des 
sequences-cible variees [JOSEPHSEN et KLAENHAMMER, Plasmid, 
23, 71-75 (1989)] ; il est done particulierement souhaitable 
d'isoler de nouveaux mecanismes, de specif icite differente de 

15 celle des mecanismes deja connus. 

Les Inventeurs ont maintenant isole de nouveaux 
mecanismes R/M de type Ic, actifs chez des bacteries 
lactiques, et ont exprime les genes codant pour leurs 
differents constituants . 

20 La presente invention a pour objet un polypeptide 

constituant l'une des sous-unites HsdR, HsdM, ou HsdS d'un 
mecanisme de resistance aux bacteriophages R/M de type Ic, 
caracterise en ce que ledit mecanisme est actif contre les 
phages des bacteries lactiques . 

25 Selon un mode de realisation prefere d'un 

polypeptide constituant une sous-unite HsdR conforme a la 
presente invention, il comprend la sequence (I) 
suivante (representee en code 1-lettre) : 

KRLARK 

30 Selon un mode de realisation prefere d'un 

polypeptide constituant une sous-unite HsdM conforme a la 
presente invention, il comprend au moins 1'une des sequences 
suivantes (representees en code 1-lettre) : 

- la sequence ( II ) : 

3 5 GLX^YKYLS 

dans laquelle Xx represente I ou L, 

- la sequence (III) : 

ENDX 2 NLNI PRYVDTFEEEE 

dans laquelle X2 represente Y ou F 
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Selon un mode de realisation prefere d' un 
polypeptide constituant une sous-unite HsdS conforme a la 
presente invention, il coraprend : 

* un domaine N-terminal d' environ 150 a 180 
5 acides amines, comprenant la sequence (IV) suivante : 

PX 3 LRFX 4 GFTX 5 DDWEERKX 6 

dans laquelle X3 represente E ou Q, X 4 represente 
E, P, D, ou K, X5 represente N ou D, Xg represente L ou F ; 

* un domaine central, d' environ 50 a 80 acides 
10 amines, comprenant la sequence (V) suivante : 

3# 7 KrGK 8 FFKX 9 II2X 10 TK^ 

dans laquelle X7 represente R ou Q, Xq represente 
S, N, ou L, X 9 represente E, H, ou Q', X 10 represente A, D, ou 
N, X X1 represente A, ou V, X 12 represente L ou F, X 13 
15 represente A ou S, X 14 represente I ou V, X 15 represente E ou 
G, X ie represente D ou E / 

* un domaine C-terminal, d' environ 160 a 200 
acides amines, comprenant la sequence (VI) suivante : 

EQX 15 X 16 IGSFFKQLDX 17 TIX 18 LHQRKLX 19 

20 dans laquelle X 15 represente K ou Q, X 16 

represente K ou Q, X 17 represente N ou D, X 18 represente T, 
A, ou V, X 19 represente A, ou D ; 

et/ou la sequence (VII ) suivante : 

GFLQKMFX 20 

25 dans laquelle X 2 o represente V ou H. 

La presente invention englobe en particulier : 
- les polypeptides HsdR repondant a l'une des 
sequences respectivement representees dans la liste de 
sequences en annexe sous les numeros SEQ ID NO: 2 et 
30 SEQ ID NO: 4 ; 

~ les polypeptides HsdM repondant a l'une des 

sequences respectivement representees dans la liste de 

sequences en annexe sous les numeros SEQ ID NO: 6 , et 
SEQ ID NO: 8 ; 

35 " les polypeptides HsdS repondant a l'une des 

sequences respectivement representees dans la liste de 
sequences en annexe sous les numeros SEQ ID NO: 10, 
SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16. 
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L' association de l'un quelconque des polypeptides 
HsdR, avec l'un quelconque des polypeptides HsdM et l'un 
quelconque des polypeptides HsdS confornies a 1' invention 
permet d'obtenir un complexe enzymatique constituant un 
5 mecanisme R/M de type Ic actif chez les bacteries lactiques. 
La specif icite d' action de ce mecanisme est conditionnee par 
le polypeptide HsdS. Les sequences (IV), (V), (VI) et (VII) 
representent des regions conservees des polypeptides HsdS 
chez les bacteries lactiques (et en particulier chez les 

10 lactocoques) , qui sont probablement impliquees dans 
1' association de ces polypeptides avec les polypeptides HsdR 
et HsdM ; ces regions conservees sont separees par des 
regions variables impliquees dans la reconnaissance de 
sequences nucleotidiques specif iques . 

15 La presente invention a egalement pour objet les 

sequences d' acide nucleique codant pour les polypeptides 
definis ci-dessus, ainsi que leurs complementaires . 

Des sequences d'ADN conformes a l f invention sont 
par exemple representees par : 

20 - les sequences hsctR SEQ ID NO:l, et SEQ ID NO: 3, 

qui codent respect ivement pour les polypeptides SEQ ID NO: 2, 
et SEQ ID NO: 4; 

- les sequences hsdM SEQ ID NO: 5, et SEQ ID NO: 7, 
qui codent respectivement pour les polypeptides SEQ ID NO: 6, 

25 et SEQ ID NO: 8 ; 

- les sequences hsdS SEQ ID NO: 9, SEQ ID NO: 11, 
SEQ ID NO: 13, et SEQ ID NO: 15 qui codent respectivement pour 
les polypeptides SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14 et 
SEQ ID NO: 16 . 

30 La presente invention a egalement pour objet des 

fragments d' acide nucleique d' au moins 18 pb, homologues ou 
complementaires de tout ou partie d' une sequence d' acide 
nucleique codant pour un polypeptide HsdR, HsdM, ou HsdS 
conforme a 1 ! invention. 

35 Ces fragments peuvent en particulier etre 

utilises comme sondes d' hybridation, et/ou amorces 
d' amplification, pour detecter et selectionner des souches de 
bacteries lactiques, ou des plasmides heberges par ces 
souches, contenant au moins une sequence codant pour un 
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polypeptide HsdR, HsdM, ou HsdS conforme a 1' invention, et 
pour isoler et/ou doner ladite sequence a partir d' une 
souche ou d'un plasmide selectionne de la sorte. 

Des sous-fragments preferes sont ceux qui sont 
5 situes dans des sequences codant pour des regions conservees 
entre les sous-unites HsdR, entre les sous-unites HsdM ou 
entre les sous-unites HsdS des mecanismes R/M de type Ic 
conformes a 1' invention. 

Par exemple : 

10 - pour selectionner des souches de bacteries 

lactiques contenant une sequence codant pour une sous-unite 
HsdR f et/ou pour doner ladite sequence, on utilisera 
avantageusement au moins un oligonucleotide homologue ou 
complementaire d' une sequence codant pour au moins 6 acides 
15 amines consecutifs de l'un des peptides suivants (representes 
en code 1-lettre) : 

TGSGKT 

KRLARK 

LLTGFDS 

20 qui correspondent a des regions conservees des 

sous-unites HsdR chez L. lactis, identifiees par les 
Inventeurs a partir des sequences SEQ ID NO: 2 et SEQ ID NO: 4 

pour selectionner des souches de bacteries 
lactiques contenant une sequence codant pour une sous-unite 

25 HsdM, et/ou pour doner ladite sequence, on utilisera 
avantageusement au moins un oligonucleotide homologue ou 
complementaire d'une sequence codant pour au moins 6 acides 
amines consecutifs de l'un des peptides suivants : 
FYKYLS 

30 LARMNL 

LPHGVLFRGAAE 
NLNI PRYVDTFEEEE 

qui correspondent £ des regions conservees des 
sous-unites HsdM chez L. lactis, identifiees par les 
35 Inventeurs en alignant les sequences SEQ ID NO: 6 et 
SEQ ID NO: 8 ; 

pour selectionner des souches de bacteries 
lactiques contenant une sequence codant pour une sous-unite 
HsdS, et/ou pour isoler et doner ladite sequence, on 
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utilisera avantageusement au moins un oligonucleotide 
homologue ou complementaire d'une sequence codant pour au 
moins 6 acides amines consecutifs de l'un des peptides 
suivants : 

DDWEERK 

LHQRKLDLLKEQKKGY 

QKMFPKNG 

PELRPA 

FADDWE 

IGSFFKQKD 

GFLQKMF 

qui correspondent a des regions conservees des 
sous-unites HsdS chez L. lactis, identifiees par les 
Inventeurs a partir des sequences SEQ ID NO: 10, SEQ ID NO: 12, 
SEQ ID NO:14 et SEQ ID NO:16. 

Les sequences d'ADN conformes a 1' invention 
peuvent etre utilisees pour exprimer dans une bacterie 
lactique un ou plusieurs mecanismes R/M de type Ic, afin 
d'augmenter sa resistance aux bacteriophages. 

Conf ormement a 1' invention, pour permettre 
1' expression dans une bacterie, en particulier une bacterie 
lactique, d' au moins un mecanisme de resistance aux 
bacteriophages R/M de type Ic de bacterie lactique, on 
procede a la transformation de ladite bacterie avec au moins 
une sequence d'ADN conforme a 1' invention. 

Le procede conforme a 1' invention peut etre mis 
en oeuvre de differentes manieres. Par exemple, si la 
bacterie-hote ne contient naturellement aucune sequence 
codant pour l'une des sous-unites HsdR, HsdM ou HsdS, elle 
devra etre transformee par au moins trois sequences d'ADN, 
dont chacune code pour l'un de ces polypeptides. Si, en 
revanche, la bacterie-hote contient deja au moins une 
sequence (portee par le chromosome bacterien ou par un 
plasmide, codant pour l'une des sous-unites HsdR, HsdM, ou 
HsdS, il suffira de la transformer avec une ou des 
sequence(s) codant pour la ou les sous-unite (s) manquante (s) . 

Avantageusement, a partir d'une meme souche de 
bacterie-hote qui contient au moins une sequence codant pour 
une sous-unite HsdR et au moins une sequence codant pour une 

i > 
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sous-unite HsdM, on peut, par transformation avec differentes 
sequences codant pour des sous-unites HsdS de specificite 
differentes, obtenir des souches presentant des 
caracteristiques de resistance differentes, et limiter 
5 1' emergence de phages echappant au mecanisme de resistance. 

Avantageusement, pour elargir le spectre de 
resistance aux bacteriophages, on pourra utiliser 
simultanement, dans une meme bacterie-hote des sequences 
codant pour des sous-unites HsdS de specificite differentes ; 

10 on pourra egalement, dans le meme but, exprimer dans la 
bacterie transformee un mecanisme de resistance aux 
bacteriophages choisi parmi les mecanismes Abi, et les 
mecanismes R/M de type II. Dans ce cas,, il est possible 
d' utiliser une bacterie-hote comprenant deja au moins une 

15 sequence codant pour un mecanisme Abi et/ou au moins une 
sequence codant pour un mecanisme R/M de type II, ou 
d' introduire a la fois dans la bacterie-hote, la ou les 
sequences codant pour le(s) mecanisme (s) Abi et/ou R/M de 
type II, et la ou les sequence (s) codant pour la ou les sous- 

20 unite (s) HsdR, HsdM ou HsdS. 

Dans des bacteries transformees obtenues 
conformement a 1' invention, les sequences codant pour les 
mecanismes de resistance aux bacteriophages et en particulier 
celles codant pour les sous-unites HsdR, HsdM, ou HsdS 

25 conformes a I 1 invention, peuvent etre portees par une meme 
molecule d'ADN (chromosome bacterien ou plasmide), ou par des 
molecules d'ADN differentes. Plusieurs sequences portees par 
une meme molecule d'ADN, peuvent faire partie d'une meme 
unite de transcription, ou bien d' unites de transcription 

30 differentes. Elles peuvent etre placees sous controle de leur 
propres sequences de regulation de la transcription, ou sous 
controle de sequences heterologues, actives dans la bacterie- 
hote . 

On peut par exemple exprimer les sequences codant 
35 pour les sous-unites HsdR, HsdM, ou HsdS a sous controle de 
sequences promoteur permettant une expression constitutive, 
ou, avantageusement, sous controle de sequences promoteur 
permettant une expression inductible, par exemple un 
promoteur inductible par le froid tel que celui decrit dans 
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la Demande FR 9615731 au nom de l'INSTITUT NATIONAL DE LA 
RECHERCHE AGRONOMIQUE . 

Pour mettre en aeuvre le procede selon 
1' invention, on peut utiliser des plasmides naturels, 
5 prealablement selectionnes a l'aide de sondes d'acide 
nucleique conformes a l 1 invention, et contenant au moins une 
sequence codant pour une sous-unite HsdR, HsdM, ou HsdS d'un 
mecanisme R/M de type Ic de bacterie lactique. 

La presente invention a egalement pour objet des 

10 vecteurs recombinants, caracterises en ce qu'ils resultent de 
1' insertion d' au moins une sequence d'acide nucleique 
conforme a 1' invention dans un vecteur approprie, et en 
particulier des vecteurs recombinants utilisables pour 
transformer des bacteries conf ormement a 1' invention. 

15 Selon 1 'utilisation envisagee, on peut choisir 

soit des vecteurs capables de se repliquer et de se maintenir 
dans la bacterie-hote sous forme de plasmide, tel que par 
exemple les plasmides pIL252 et pIL253 decrits par SIMON et 
CHOPIN, [Biochimie, 70, p. 559-566, (1988)], soit des 

20 vecteurs permettant 1 ' integration des inserts qu' il portent 
dans l'ADN chromosomique de la bacterie-hSte , tels que par 
exemple les vecteurs decrits dans la Demande PCT WO 94/16086 
au nom de BIOTEKNOLOGISK INSTITUT et CHR. HASSEN'S 
LABORATORIUM DANMARK A/S, ou bien le plasmide pG + host5 decrit 

25 par BISWAS et al . [J. Bact . , 175, p. 3628-3635, (1995)]. 

De maniere plus generale, des vecteurs 
plasmidiques ainsi que des vecteurs d' integration utilisables 
chez les lactocoques sont decrits dans la revue de 
LEENHOUTS K.J. and VENEMA G. (1993). Lactococal plasmid 

30 vectors, In : K.G. HARDY (ed) Plasmids. A practical approach. 
Second Edition. IRL Press, Oxford, p. 65-94. 

Si plusieurs vecteurs sont utilises pour 
introduire dans la bacterie-hote les differentes sous-unites 
HsdR, HsdM, et HsdS, et eventuellement d'autres mecanismes de 

35 resistance aux bacteriophage, on choisira des vecteurs 
compatibles entre eux. 

La presente invention peut etre avantageusement 
mise en oeuvre dans tous les domaines ou intervient une 
fermentation industrielle, et en particulier dans l'industrie 



BNSDOCID: <FR 2767831 A 1_l_> 



10 



2767831 



laitiere et fromagere. Des souches bacteriennes possedant une 
resistance accrue aux bacteriophages peuvent etre obtenues 
conf ormement a 1' invention, a partir de souches de bacteries 
lactiques d'interet industriel, soit par selection de 
5 bacteries possedant nature llement un systeme R/M de type Ic 
grace aux sondes d'acide nucleique conformes a 1' invention, 
soit par transformation de bacteries -hote a l'aide de 
sequences d'acide nucleique conformes a 1* invention- 
La presente Invention sera mieux comprise a 
10 1 1 aide du complement de description qui va suivre, qui se 
r£fere a des exemples de clonage de sequences codant pour des 
sous-unites de mecanismes R/M de type Ic, et d' utilisation de 
ces sequences pour accroitre la resistance de bacteries hote 
aux attaques des bacteriophages. 

15 EXEMPLE 1 : OBTENTION DE FRAGMENTS D'ADN CODANT POUR DES 
SOUS - UNITES HsdS DE MECANISMES R/M DE TYPE Ic 

La manipulation de 1 1 ADN, le clonage et la 
transformation de cellules bacteriennes sont, en 1' absence de 
precisions contraires, effectues selon les protocoles decrits 
20 par SAMBROOK et al. [(Molecular cloning : a laboratory 
manual., Cold Spring Harbor Laboratory, Cold Spring Harbor 
N. Y. (1989) ] . 

GAUTIER et CHOPIN [App. Environ. Microbiol. 53, 
923-927 (1987)], et CHOPIN et al., [Plasmid, 11, pp. 260-263, 
25 (1984)] ont decrit l'existence de mecanismes de resistance 
aux phages de type R/M, respectivement associes aux plasmides 
pIL 103 et pIL7. 

L^ADN _de_pI_L 103 a _ete digere par __EcoRI , et _les 

fragments obtenus ont ete ligatures au site EcoRI du vecteur 

30 pIL204 [SIMON et CHOPIN, Biochimie 10, 559-566, (1988)]. Le 
melange de ligation a ete utilise pour transformer des 
bacteries L. Lactis ssp lactis de la souche IL1403. Les 
colonies bacteriennes ont ete selectionnees sur la base de 
leur resistance au phage bIL67 . Un plasmide recombinant 

35 portant un insert de 3,7 kb environ a ete obtenu a partir de 
clones bacteriens resistant a I'attaque phagique. Ce plasmide 
recombinant a ete denomme pIL261. 
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De maniere surprenante, le sequencage de 1' insert 
de 3,7 kb du plasmide pIL261 n'a fait apparaitre aucune 
sequence presentant une homologie avec celles des mecanismes 
R/M connus chez les lactocoques. 
5 Cependant, 2 cadres de lecture orfl et orf2 ont 

ete localises sur ce fragment de 3,7 kb ; 

Le cadre de lecture orfl code pour une proteine 
presentant une forte homologie avec des proteines RepB deja 
identifiees chez les lactocoques. 

10 La sequence de la proteine codee par le cadre de 

lecture orf2 ne presente aucune homologie avec des sequences 
connues de proteines de bacteries lactiques ; toutefois, la 
region centrale et la region N-terminale de cette proteine 
contiennent des sequences repetees possedant une certaine 

15 homologie avec des sequences consensus repetees des sous- 
unites HsdS de systemes R/M de type Ic des enterobacteries et 
des mycoplasmes . 

Une sequence d'acide nucleique contenant le cadre 
de lecture orf2, et la sequence du polypeptide correspondant 

20 sont respect ivement representees dans la liste de sequences 
en annexe sous les numeros SEQ ID NO : 13 et SEQ ID NO : 14. 

De maniere similaire, le sequencage du plasmide 
pIL7 a permis de mettre en evidence un cadre de lecture 
codant pour une proteine presentant une homologie importante 

2*5 avec celle codee par le cadre de lecture orf2 du plasmide 
pIL261, et possedant egalement des sequences repetees 
rappelant celles des sous-unites HsdS des systemes R/M de 
type I. 

Une sequence d' acide nucleique contenant ce 
3 0 troisieme cadre de lecture, et la sequence du polypeptide 
correspondant sont respectivement representees dans la liste 
de sequences en annexe sous les numeros SEQ ID NO : 15 et SEQ 
ID NO : 16. 

Des sondes oligonucleotidiques, derivees des 
35 sequences codant pour des regions conservees entre les 
sequences SEQ ID NO : 14 et SEQ ID NO : 16 ont ete utilisees 
pour rechercher 1' existence d'autres sequences homologues de 
type hsdS. Ces sondes ont permis la mise en evidence de 
sequences de ce type, sur l'ADN chromosomique de la souche 
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IL1403, ainsi que sur un plasmide issu de la souche de L. 
lactis ssp. lactis IL420, heberge par IL403. 

La sequence de type hsdS obtenue a partir de 
l'ADN chromosomique de la souche IL1403, et la sequence du 
5 polypeptide correspondant sont respectivement representees 
dans la liste de sequences en annexe sous les numeros SEQ ID 
NO : 9 et SEQ ID NO : 10 

La sequence de type hsdS obtenue a partir du 
plasmide issu de la souche de L. lactis ssp. lactis IL420, et 
10 la sequence du polypeptide correspondant sont respectivement 
representees dans la liste de sequences en annexe sous les 
numeros SEQ ID NO : 11 et SEQ ID NO : 12. 

EXEMPLE 2 : OBTENTION DE FRAGMENTS D'ADN CODANT POUR DBS 
SOUS -UNITES HsdR ET HsdM DE MECANISMES R/M DE TYPE Ic 

15 Les regions du chromosome de la souche IL1403, et 

du plasmide issu de la souche IL420 sur lesquelles ont ete 
localisees les sequences de type hsdS ont ete entierement 
sequencees . 

Ce sequencage a permis de mettre en evidence, 
20 dans les 2 cas, directement en amont de la sequence hsdS, 2 
cadres de lecture ouverte, codant pour des proteines 
contenant respectivement des regions presentant une homologie 
importante avec des domaines conserves des sous-unites R et M 
des systemes R/M de type Ic d' enterobacteries et de 
25 mycoplasmes. Ces 2 cadres de lecture ouverte ont ete 
respectivement denommes, du fait de cette homologie, hsdR et 
hsdM. 

_Sur _le_ chromosome de _la souche _IL1403, xomme- sur- 

le plasmide issu de la souche IL420, l'ordre des cadres de 
30 lecture ouverte est, d' amont en aval : hsdR, hsdM et hsdS. 

La sequence de type hsdR obtenue a partir de 
l'ADN chromosomique de la souche IL1403, et la sequence du 
polypeptide correspondant sont respectivement representees 
dans la liste de sequences en annexe sous les numeros SEQ ID 
35 NO : 1 et SEQ ID NO : 2. 

La sequence de type hsdM obtenue a partir de 
l'ADN chromosomique de la souche IL1403, et la sequence du 
polypeptide correspondant sont respectivement representees 
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dans la liste de sequences en annexe sous les numeros SEQ ID 
NO : 5 et SEQ ID NO : 6. 

La sequence de type hsdR obtenue a partir du 
plasmide issu de la souche de L. lactis ssp. lactis IL420, et 
la sequence du polypeptide correspondant sont respectivement 
representees dans la liste de sequences en annexe sous les 
numeros SEQ ID NO : 3 et SEQ ID NO : 4 

La sequence de type hsdM obtenue a partir du 
plasmide issu de la souche de L. lactis ssp_ lactis IL420, et 
la sequence du polypeptide correspondant sont respectivement 
representees dans la liste de sequences en annexe sous les 
numeros SEQ ID NO : 7 et SEQ ID NO : 8. 

EXEMPLE 3 : UTILISATION D' OLIGONUCLEOTIDES DERIVES DES 
SEQUENCES HSDR, HSDM ET HSDS POUR LA DETECTION DE SOUCHES 
BACTERIENNES POSSEDANT DES SOUS - UNITES DE SYSTEMES R/M DE 
TYPE Ic. 

Des regions des sequences hsdM du plasmide issu 
de la souche IL420, et du chromosome de la souche IL1403, 
codant pour les memes sequences peptidiques ont ete 
identif iees . 

Les oligonucleotides suivants : 

* oligo 66 : TTA GCA CGT ATG AAC TTA 

* oligo 67 : TTG GCT CGA ATG AAT TTA 
representent des sequences qui codent 

respectivement dans le plasmide de la souche IL420, et dans 
le chromosome de la souche IL14 03, pour la sequence 
peptidique (code 1 lettre) LARMNL . 

Les oligonucleotides suivants : 

* oligo 68 : CTC TTC AAA GGT ATC CAC 

* oligo 69 : TTC CTC AAA GGT ATC TAC 
representent des sequences complementaires des 

sequences codant respectivement, dans le chromosome de la 
souche IL1403, et dans le plasmide de la souche IL420, pour 
la sequence peptidique (code 1 lettre) VDTFEE. 

Ces oligonucleotides sont utilises comme amorces 
d' amplification par PCR (couples 66/69 et 67/68) sur 16 
souches differentes de lactocoques. 
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Les conditions d 1 amplification utilisees sont les 
suivantes : l'ADN extrait de chacune des souches est mis en 
presence de desoxyribonucleotides triphosphate (0,2 mM de 
chaque) , de 0,1 ^iM de chaque amorce, et. de 2,5 Unites de Taq 
5 polymerase (PROMEGA) dans un tampon standard pour Taq 
polymerase (PROMEGA) . La reaction s'effectue dans un volume 
final de 100 ^il . 

Apres denaturation (94 °C, 5 minutes), on effectue 
30 cycles alternant une etape de fixation des amorces a 50°C 
10 pendant 30 secondes, une etape d' extension a 72°C pendant 30 
secondes, et une etape de denaturation a 94 °C pendant 3 0 
secondes . 

Comme le montre le Tableau I ci-dessous, pour 8 
des 16 souches testees (IL582, IL858, IL910, IL993, IL964, 
15 IL827, IL854, MG1363) on observe, avec 1'un ou 1' autre des 2 
couples d' amorces la presence d' un produit d' amplification de 
la longueur attendue (environ 670 pb) . 
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TABLEAU I 



SOUCHE 


AMORCES 




66/69 


67/68 


IL827 (D) 


+ 


++ 


IL910 (L) 


+ + 


— 


IL2967 (L) 


— 


— 


CNRZ194 (C) 


— 


— 


CNRZ34 0 (D) 


— 


— 


CNRZ106 (C) 




— 


IL2034 






IL854 (C) 


+ /- 




IL993 (C) 




+ + 


IL858 (C) 


+ 


+ + 


CNRZ10S (C) 






CNRZ269 (D) 




IL582 (L) 


+/- 


+ + 


IL960 (L) 






IL964 (C) 


+ /- 


+ + 


MG1363 (L) 


+ 





(L) : ssp. lactis 

(D) ssp. lactis biovar. diacetylactis 
(C) ssp. cremoris 



5 ++ produit d' amplification nettement detectable ; 
+ produit d' amplification detectable ; 
+/- produit d' amplification faiblement detectable ; 
- pas de produit d' amplification detectable. 

Les produits d f amplification obtenus a partir des 

10 souches IL582, IL858, IL91Q, IL993, MG1363, IL827, IL854, 
IL964 f ont ete sequences. Chez les souches IL582/ IL858, 
IL993, IL827, IL854, IL964 f la sequence est tres semblable a 
la sequence hsdM du chromosome de la souche IL14 03, et chez 
les souches IL910 et MG1363 la sequence est tres semblable a 

15 la sequence hsdM du plasmide de la souche IL420. 

EXEMPLE 4 : RESISTANCE A L 1 ATTAQUE PHAGIQUE CONFEREE PAR LES 
SOUS-UNITES HsdR, HsdM ET HsdS • 

Les souches utilisees sont : les souches MG1363 r 
et IL582 qui possedent chacune une sequence codant pour la 
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sous-unite M d' un systeme R/M de type Ic, et la souche 
IL1403, qui possede sur son chromosome des sequences codant 
pour les 3 sous-unites R, M et S d'un systeme R/M de type Ic. 

Les bacteries sont cultivees et infectees par les 
5 phages dans les conditions decrites par TERZAGHI et SANDINE, 
[Appl. Microbiol., 29, 807-815, (1975)] 

Les resultats de 1' infection sont exprimes en 
PFU/ml, et l'efficacite de propagation (eop) est determinee, 
pour chaque essai, par le rapport entre le nombre de PFU/ml 
10 pour la souche bacterienne testae, et le nombre de PFU/ml 
pour une souche bacterienne choisie comme temoin. 

Le tableau II ci-dessous montre les resultats 
obtenus avec le phage c2 sur la souche MG1363, choisie comme 
temoin, et la souche IL1403. 
15 TABLEAU II 



SOUCHE 


NOMBRE DE 
PHAGES (PFU/ML) 


EOP 


MG1363 


10 9 


1 


IL1403 


2, 8*10 7 


3*10" 2 



Le tableau III ci-dessous montre les resultats 



obtenus avec le phage bIL67 (prealablement propage sur la 
souche IL1403) sur : 

- la souche IL1403 sans plasmides (1), et 
20 - la souche IL582 (5) 

choisies comme temoins, 

la souche IL1403 transformee avec le plasmide 
issu de la souche IL420, portant des sequences hsdR, hsdM et 
hsdS (2) . 

25" - la souche IL1403 transformee avec le plasmide 

piL7, portant une sequence hsdS (3) 

- la souche IL1403 transformee avec le plasmide 
pIL261 portant une sequence hsdS (A) 

- la souche IL582 transformee avec le plasmide 
30 pIL261 portant une sequence hsdS (6) 
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TABLEAU III 



SOUCHE 


NOMBRE DE 


EOP 




PHAGES (PFU/ML) 




1 


6x10 


1 


2 


3<10 


5x10 


3 


3,7xl0 7 


6*10~ 3 


4 


4xl0 3 


6*10" 7 


5 


4xl0 9 


1 


6 


3xl0 4 


1,8*10~ 5 



Ces resultats montrent que : 

* Les sous-unites HsdS des differents mecanismes 



de resistance ont ef f ectivement une specificite differente : 
5 le mecanisrae porte par le chromosome de la souche IL1430 est 
faiblement efficace contre le phage bIL67 , alors qu'en 
revanche les sous-unites HsdS portees par les plasmides 
augmentent, a un degre plus ou moins eleve, la resistance a 
ce phage . 

10 * Les sous-unites HsdS codees par les plasmides 

pIL7 et pIL261 peuvent s'associer avec les sous-unites HsdR 
et HsdM codees par le chromosome de IL14 30 pour reconstituer 
un complexe R/M de type Ic fonctionnel. 
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LISTE DE SEQUENCES 

(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3050 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 
(Vi) ORIGINE: 

(A) ORGANISME: Lactococcus lactis 

(ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 44. .3031 

(D) AUTRES INFORMATIONS : /products "HsdR" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: X: 

AAAGATAACA AAAATCATGC ATTATTGAGA GGGAGAAAAA GGA ATG GCA GAA GCA 55 

Met Ala Glu Ala 
1 

AAA TTT GAA GCT GCT TTG ATC AAA AAA CTA GAA GCA GAA GGA TGG ACC 103 
Lys Phe Glu Ala Ala Leu lie Lys Lys Leu Glu Ala Glu Gly Trp Thr 
5 10 15 20 

TAT CGT AAA GAT TTA TCT TAT GTC TCT ATT AAG GTC TTA GAG GGA CAC 151 
Tyr Arg Lys Asp Leu Ser Tyr Val Ser lie Lys Val Leu Glu Gly His 
25 30 35 

TGG CGT GAG GTG CTT AAT GAA AAT AAT GCT TAT AAA TTA AAT GGC AAA 199 
Trp Arg Glu Val Leu Asn Glu Asn Asn Ala Tyr Lys Leu Asn Gly Lys 
40 45 50 

CCT TTG TCT GAT GTT GAA TTT GGC TTA GTG ATG CAA GAA GTT CAA AGG 247 
Pro Leu Ser Asp Val Glu Phe Gly Leu Val Met Gin Glu Val Gin Arg 
55 60 65 

ATT AAA ACG CCT TAT GAT GCT CAA CTT TTA TTG GTA GGG GCA GGA GGT 2 95 

lie Lys Thr Pro Tyr Asp Ala Gin Leu Leu Leu Val Gly Ala Gly Gly 
70 75 80 

GTC _GGC TCT -ATT CCT -ATA ACA CGA GAT G AC GGC TCT AAC TTA GAA "GTA _ 343" 
Val Gly Ser lie Pro He Thr Arg Asp Asp Gly Ser Asn Leu Glu Val 
85 90 95 100 

GAG ATT TTT TAT GAA GAT GAT GTG GCT GGT GGT CGG TCA CGC TAT GAA 391 
Glu He Phe Tyr Glu Asp Asp Val Ala Gly Gly Arg Ser Arg Tyr Glu 
105 110 115 

GTC GTC AGC CAA GTG ATT TTT GAT GAG CTC CCT CAT GGA CTA GCG AGC 439 
Val Val Ser Gin Val He Phe Asp Glu Leu Pro His Gly Leu Ala Ser 
120 125 130 

AAA AGA ATT ATT GAT TTA GCC TTG CTT ATT AAC GGA ATC CCA GTA GCG 487 
Lys Arg He He Asp Leu Ala Leu Leu He Asn Gly He Pro Val Ala 
135 140 145 
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CAT ATT GAA GAA AAA GAT GAA CAC TTA CAA AAC CAA TGG GGC GCT TTT 535 
His He Glu Glu Lys Asp Glu His Leu Gin Asn Gin Trp Gly Ala Phe 
150 155 160 

GAG CAA TTA AAA GGG TAT CAC GGA GAA GGC TTA TAT GAG GGA TTA TTT 583 
Glu Gin Leu Lys Gly Tyr His Gly Glu Gly Leu Tyr Glu Gly Leu Phe 
165 170 175 180 

GCT TTT GTT CAA GTT CAA TTT ATC TTG AGT CAA CAC TCT GCC AAC TAT 631 
Ala Phe Val Gin Val Gin Phe He Leu Ser Gin His Ser Ala Asn Tyr 
185 190 195 

TTT GCC CGT CCT AAT CGT CTT GAA AAT TAT AAC AAA ACT TTT GTT TTT 679 
Phe Ala Arg Pro Asn Arg Leu Glu Asn Tyr Asn Lys Thr Phe Val Phe 
200 205 210 

GGT TGG CGA GAT GAG CAA CAG AAA GAT ATC ACT GAT GCG TTT GTC TTT 727 
Gly Trp Arg Asp Glu Gin Gin Lys Asp He Thr Asp Ala Phe Val Phe 
215 220 225 

GCC CAT CAA GTG TTA GGA ATC CCT GCA CTT CAT CGA CTA GTG ACT GTG 775 
Ala His Gin Val Leu Gly He Pro Ala Leu His Arg Leu Val Thr Val 
230 235 240 

AAC ATG ATT CCA GAT GCT TCC AAT AGT AAT TTG ATG GTG ATG AGA AGT 823 
Asn Met He Pro Asp Ala Ser Asn Ser Asn Leu Met Val Met Arg Ser 
245 250 255 260 

TAT CAA ATT CAA GCC ACA AGA GCG ATT TTA CAG CGT ATG AAA GAA ATG 871 
Tyr Gin He Gin Ala Thr Arg Ala He Leu Gin Arg Met Lys Glu Met 
265 270 275 

GAA CAT AAC GAC TAC ATT CAA AAG GAA GGG GGC TAT ATC TGG CAT ACC 919 
Glu His Asn Asp Tyr He Gin Lys Glu Gly Gly Tyr He Trp His Thr 
280 285 290 

ACT GGG TCG GGT AAA ACG GTG ACT TCT TTT AAA GTA GCC CAG CTA CTA 967 
Thr Gly Ser Gly Lys Thr Val Thr Ser Phe Lys Val Ala Gin Leu Leu 
295 300 305 

GCG GCT GCC CCT AAA GTA AAA AAT GTT TTA TTT ATT GTT GAT CGT GTG 1015 
Ala Ala Ala Pro Lys Val Lys Asn Val Leu Phe He Val Asp Arg Val 
310 315 320 

GAC TTA GTG GAT CAA ACG TTA GAA AAC TTT AAA GAT TTT GCT TAC ATT 1063 
Asp Leu Val Asp Gin Thr Leu Glu Asn Phe Lys Asp Phe Ala Tyr He 
325 330 335 340 

CAA TTT AAA AAT AGA ATT AAA AAA GTA AAT GGT AGG GAG TTA AAA CGA 1111 
Gin Phe Lys Asn Arg He Lys Lys Val Asn Gly Arg Glu Leu Lys Arg 
345 350 355 

GAG TTG AGC CAT AAA GGT GCT TCA CAG ATC TTA TTA ATT TCT GTC CAA 1159 
Glu Leu Ser His Lys Gly Ala Ser Gin He Leu Leu He Ser Val Gin 
360 365 370 

GGT TTA ACA AAA GCC GTT AAA AAT GGG CTA AAA AAT ACC GAT CGA AAT 1207 
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Gly Leu Thr Lys Ala Val Lys Asn Gly Leu Lys Asn Thr Asp Arg Asn 
375 380 385 

GTC ATT ATT ATG GAT GAA GCA CAT CGA AGT GCT AAT GGA GAA TCG GTT 1255 
Val He He Met Asp Glu Ala His Arg Ser Ala Asn Gly Glu Ser Val 
390 395 400 

CAG CTT ATT AAA AGT GCC TTT CAA AAA ACG ACT TGG TTT GGG TTT ACA 1303 
Gin Leu He Lys Ser Ala Phe Gin Lys Thr Thr Trp Phe Gly Phe Thr 
405 410 415 420 

GGA ACT CCT AAT TTT TAT AGT GAC GAG ATT AAT GAC GTT CAA ACC ACT 1351 
Gly Thr Pro Asn Phe Tyr Ser Asp Glu He Asn Asp Val Gin Thr Thr 
425 430 435 

CGA GAC ATT TCA ACC CAT GAT ATT TTT GGG AAG AGA CTC CAT TCT TAT 1399 
Arg Asp He Ser Thr His Asp He Phe Gly Lys Arg Leu His Ser Tyr 
440 445 450 

ACC ATC AAG GAT GCG ATT GGA GAT GGA AAC GTG TTA GGG TTT GAT ATT 1447 
Thr He Lys Asp Ala He Gly Asp Gly Asn Val Leu Gly Phe Asp He 
455 460 465 

ACT TAC TTT AAT CCC ACG ATT GAA ATT GAA TCA CTT GAC GAA GAA CAT 1495 
Thr Tyr Phe Asn Pro Thr He Glu He Glu Ser Leu Asp Glu Glu His 
470 475 480 

TCC GAA AAA GAT TAT GAA AAA GAA GTT TAT CAA AGT CAT GTT TAT CGA 1543 
Ser Glu Lys Asp Tyr Glu Lys Glu Val Tyr Gin Ser His Val Tyr Arg 
485 490 495 500 

GAA CAA GTG GTG CAA GAC ATT TTA AAC CTT TGG GAT AAA ACG TCA AGT 1591 
Glu Gin Val Val Gin Asp He Leu Asn Leu Trp Asp Lys Thr Ser Ser 
505 510 515 

GGG GCT TTG GTC GCT GGC AAA CGA GAA AAG AAT GTT TTT CAG GCG ATG 1639 
Gly Ala Leu Val Ala Gly Lys Arg Glu Lys Asn Val Phe Gin Ala Met 
520 525 530 

TTA GCT GTT TCA GGA AAG CAA GCC GTG GTT CAT TAC TAC AAT CTT TTT 1687 
Leu Ala Val Ser Gly Lys Gin Ala Val Val His Tyr Tyr Asn Leu Phe 
535 540 545 



AAA GAA" AAA "GCC "CCT" CAT" TTG ~AGG~GTA GCA ATG ACT TTT TCT CGA GAT 1735 
Lys Glu Lys Ala Pro His Leu Arg Val Ala Met Thr Phe Ser Arg Asp 
550 555 560 

GAA TCT AAT CAA CCT GGA ACA AAA GAA CAG AAT GAA GCC TTA AAA AAA 1783 
Glu Ser Asn Gin Pro Gly Thr Lys Glu Gin Asn Glu Ala Leu Lys Lys 
565 570 575 580 

GCG ATC AAA GAA TAC AGT AGT TGC TTC AAT GTC CCT AGT CTT TTA AAT 1831 
Ala He Lys Glu Tyr Ser Ser Cys Phe Asn Val Pro Ser Leu Leu Asn 
585 590 595 

GCT CAA GAA CCG GCA CGG GCC TAC ATG ATT GAT ATC ACT AAA CGG CTC 1879 
Ala Gin Glu Pro Ala Arg Ala Tyr Met He Asp He Thr Lys Arg Leu 
600 605 610 
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GCT CGT AAA AAA CCA TAT AAC CAA GGA AAA GAT GAG GAC CGA TTA GAT 1927 
Ala Arg Lys Lys Pro Tyr Asn Gin Gly Lys Asp Glu Asp Arg Leu Asp 
615 620 625 

CTA GTG ATT GTC TCG GAC CAA CTG CTG ACA GGA TTT GAC TCA AAA TAT 1975 
Leu Val lie Val Ser Asp Gin Leu Leu Thr Gly Phe Asp Ser Lys Tyr 
630 635 640 

ATT AAT ACG ATT TAT ATG GAT AAA GAG CTG AGA GAA GGG ATG TTA ATC 2023 
lie Asn Thr He Tyr Met Asp Lys Gin Leu Arg Glu Gly Met Leu He 
645 650 655 660 

CAA GCG ATG TCC CGG ACC AAT CGA ACG TTT CAC TTG AAC AGT AAA CCT 2071 
Gin Ala Met Ser Arg Thr Asn Arg Thr Phe His Leu Asn Ser Lys Pro 
665 670 675 

CAC GGA AAA GTT CGG TTC TAT CGT CAA GGC GAA CAA ATG AAG TCT TTT 2119 
His Gly Lys Val Arg Phe Tyr Arg Gin Gly Glu Gin Met Lys Ser Phe 
680 685 690 

GTA GAA AAT GCC CTT CGG ATT TAT ACA CGA GGG GGG AAT GAT ACG CTT 2167 
Val Glu Asn Ala Leu Arg He Tyr Thr Arg Gly Gly Asn Asp Thr Leu 
695 700 705 

CAG GGA GCA GAT GAA GAC TCC AAA AAT GAA GAT ATC CAA TCC TTA GAA 2215 
Gin Gly Ala Asp Glu Asp Ser Lys Asn Glu Asp He Gin Ser Leu Glu 
710 715 720 

GAC GAG CAT ATC CTG GCA GAA CCC CAA AGT CAT CAA ATC CCA AAA TTA 2263 
Asp Glu His He Leu Ala Glu Pro Gin Ser His Gin He Pro Lys Leu 
725 730 735 740 

ACA CCC GCT GTT CAA GAA CTA AAA GCC TTT GCG GGA GAA GAT TTT AGT 2311 
Thr Pro Ala Val Gin Glu Leu Lys Ala Phe Ala Gly Glu Asp Phe Ser 
745 750 755 

CAA ATT CCT CGT GGT GAG AAA GAT TTA AAA CAA TTT GTA AGG CTA GGG 2359 
Gin He Pro Arg Gly Glu Lys Asp Leu Lys Gin Phe Val Arg Leu Gly 
760 765 770 

CTA GAA ACA CAA AAT CAG ATT CAA CAA TTG GTT CAA CAA GGC TAT GAA 2407 
Leu Glu Thr Gin Asn Gin He Gin Gin Leu Val Gin Gin Gly Tyr Glu 
775 780 785 

TTA GGG AAC GAA ATT GAC CTA TTA GAT GCT CAA GGA GAG TCC ACT GGT 2455 
Leu Gly Asn Glu He Asp Leu Leu Asp Ala Gin Gly Glu Ser Thr Gly 
790 795 800 

GAA AAA GTT CGA CTT GAT ATT TCT AGT TTT GAG GAG TTT GGG GCT TTG 2503 
Glu Lys Val Arg Leu Asp He Ser Ser Phe Glu Glu Phe Gly Ala Leu 
805 810 815 820 

CAA GCA AGG CTT AAT GAT GCT AGA GAA AAA TTG CCC GAA GAG GAG CGT 2551 
Gin Ala Arg Leu Asn Asp Ala Arg Glu Lys Leu Pro Glu Glu Glu Arg 
825 830 835 
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CCA GAC CTC ACA GAA ATT AGA GTG GGC TTA TCT TTA TAT GAC CAT GAG 2599 
Pro Asp Leu Thr Glu lie Arg Val Gly Leu Ser Leu Tyr Asp His Glu 
840 845 850 

ATT ATT GAC TAC GAT TGG CTG GTT GAT CTC TTA AAC CTC TTC ATG GAT 2647 
He He Asp Tyr Asp Trp Leu Val Asp Leu Leu Asn Leu Phe Met Asp 
855 860 865 

CAG AAA ACT CCT GAA AAC AAA GCT TCA ATT GAG AAA CAT ATT CTC CCA 2695 
Gin Lys Thr Pro Glu Asn Lys Ala Ser He Glu Lys His He Leu Pro 
870 875 880 

TTG GAT GAA ATG AGC CAA CAA GAG ATC AAG GAT ATT ATC GTA GAT ATA 2743 
Leu Asp Glu Met Ser Gin Gin Glu He Lys Asp He He Val Asp He 
885 890 895 900 

GAA TCT GGG GAA ATT AAG GAA CAC TTT ACG AAA GCA ACC TTG GAA GAT 2791 
Glu Ser Gly Glu He Lys Glu His Phe Thr Lys Ala Thr Leu Glu Asp 
905 910 915 

CAA AGA AAG CAC AAA CGC TCG GAT CGA CAA GAG TTA AAA ATC CGT CGA 283 9 

Gin Arg Lys His Lys Arg Ser Asp Arg Gin Glu Leu Lys He Arg Arg 
920 925 930 

TGG GCG GCC AAT CAA AAA GTC AAT GGC AAT CGT ATT GTC CAA GCC TTC 2887 
Trp Ala Ala Asn Gin Lys Val Asn Gly Asn Arg He Val Gin Ala Phe 
935 940 945 

GAT CTT TTC TTA CCA GGT CAC AGC TTA GTA GAC AAT TCT CAA TTA TCA 2935 
Asp Leu Phe Leu Pro Gly His Ser Leu Val Asp Asn Ser Gin Leu Ser 
950 955 9 60 

GCG CTT GTT TCA GAA ATT GAA GCA GAG GAA AAC TTA AGC TTT TTT GGA 2983 
Ala Leu Val Ser Glu He Glu Ala Glu Glu Asn Leu Ser Phe Phe Gly 
965 970 975 980 

GCC TCA GAA TTT GAG ACT GCA TTA ATG AGC TTC TTC AAT TCA CTA TAA 3031 
Ala Ser Glu Phe Glu Thr Ala Leu Met Ser Phe Phe Asn Ser Leu * 
985 990 995 



AAAAATAAAA ATACTCGCA 

(2) INFORMATIONS POUR LA SEQ ID NO : 2: 

( i ) CARACTERTSTIQUES - DE^LA "SEQUENCE - : ~ ~~ ™~ 

(A) LONGUEUR: 996 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: protSine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 2: 

Met Ala Glu Ala Lys Phe Glu Ala Ala Leu He Lys Lys Leu Glu Ala 
1 5 10 is 

Glu Gly Trp Thr Tyr Arg Lys Asp Leu Ser Tyr Val Ser He Lys Val 
20 25 30 



3050 
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Leu Glu Gly His Trp Arg Glu Val Leu Asn Glu Asn Asn Ala Tyr Lys 
35 40 45 

Leu Asn Gly Lys Pro Leu Ser Asp Val Glu Phe Gly Leu Val Met Gin 
50 55 60 

Glu Val Gin Arg lie Lys Thr Pro Tyr Asp Ala Gin Leu Leu Leu Val 
65 70 75 80 

Gly Ala Gly Gly Val Gly Ser lie Pro He Thr Arg Asp Asp Gly Ser 
85 90 95 

Asn Leu Glu Val Glu He Phe Tyr Glu Asp Asp Val Ala Gly Gly Arg 
100 105 110 

Ser Arg Tyr Glu Val Val Ser Gin Val He Phe Asp Glu Leu Pro His 
115 120 125 

Gly Leu Ala Ser Lys Arg He He Asp Leu Ala Leu Leu He Asn Gly 
130 135 140 

He Pro Val Ala His He Glu Glu Lys Asp Glu His Leu Gin Asn Gin 
145 150 155 160 

Trp Gly Ala Phe Glu Gin Leu Lys Gly Tyr His Gly Glu Gly Leu Tyr 
165 170 175 

Glu Gly Leu Phe Ala Phe Val Gin Val Gin Phe He Leu Ser Gin His 
. 180 185 190 

Ser Ala Asn Tyr Phe Ala Arg Pro Asn Arg Leu Glu Asn Tyr Asn Lys 
195 200 205 

Thr Phe Val Phe Gly Trp Arg Asp Glu Gin Gin Lys Asp He Thr Asp 
210 215 220 

Ala Phe Val Phe Ala His Gin Val Leu Gly He Pro Ala Leu His Arg 
225 230 235 240 

Leu Val Thr Val Asn Met He Pro Asp Ala Ser Asn Ser Asn Leu Met 
245 250 255 

Val Met Arg Ser Tyr Gin He Gin Ala Thr Arg Ala He Leu Gin Arg 
260 265 270 

Met Lys Glu Met Glu His Asn Asp Tyr He Gin Lys Glu Gly Gly Tyr 
275 280 285 

He Trp His Thr Thr Gly Ser Gly Lys Thr Val Thr Ser Phe Lys Val 
290 295 300 

Ala Gin Leu Leu Ala Ala Ala Pro Lys Val Lys Asn Val Leu Phe He 
305 310 315 320 

Val Asp Arg Val Asp Leu Val Asp Gin Thr Leu Glu Asn Phe Lys Asp 
325 330 335 
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Phe Ala Tyr He Gin Phe Lys Asn Arg He Lys Lys Val Asn Gly Arg 
340 345 350 

Glu Leu Lys Arg Glu Leu Ser His Lys Gly Ala Ser Gin He Leu Leu 
355 360 365 

He Ser Val Gin Gly Leu Thr Lys Ala Val Lys Asn Gly Leu Lys Asn 
370 375 380 

Thr Asp Arg Asn Val He He Met Asp Glu Ala His Arg Ser Ala Asn 
385 390 395 " 400 

Gly Glu Ser Val Gin Leu He Lys Ser Ala Phe Gin Lys Thr Thr Trp 
405 410 415 

Phe Gly Phe Thr Gly Thr Pro Asn Phe Tyr Ser Asp Glu He Asn Asp 
420 425 430 

Val Gin Thr Thr Arg Asp He Ser Thr His Asp He Phe Gly Lys Arg 
435 440 445 

Leu His Ser Tyr Thr He Lys Asp Ala He Gly Asp Gly Asn Val Leu 
450 455 460 

Gly Phe Asp He Thr Tyr Phe Asn Pro Thr He Glu He Glu Ser Leu 
465 470 475 480 

Asp Glu Glu His Ser Glu Lys Asp Tyr Glu Lys Glu Val Tyr Gin Ser 
485 490 495 

His Val Tyr Arg Glu Gin Val Val Gin Asp He Leu Asn Leu Trp Asp 
500 505 510 

Lys Thr Ser Ser Gly Ala Leu Val Ala Gly Lys Arg Glu Lys Asn Val 
515 520 525 

Phe Gin Ala Met Leu Ala Val Ser Gly Lys Gin Ala Val Val His Tyr 
530 535 540 

Tyr Asn Leu Phe Lys Glu Lys Ala Pro His Leu Arg Val Ala Met Thr 
545 550 555 560 

Phe Ser Arg Asp Glu Ser Asn Gin Pro Gly Thr Lys Glu Gin Asn Glu 
56s 570 575 

Ala Leu Lys Lys Ala He Lys Glu Tyr Ser Ser Cys Phe Asn Val Pro 
580 585 590 

Ser Leu Leu Asn Ala Gin Glu Pro Ala Arg Ala Tyr Met He Asp He 
595 600 605 

Thr Lys Arg Leu Ala Arg Lys Lys Pro Tyr Asn Gin Gly Lys Asp Glu 
610 615 620 

Asp Arg Leu Asp Leu Val He Val Ser Asp Gin Leu Leu Thr Gly Phe 
525 630 635 640 



BNSDOCID: <FR 2767831 A1_L> 



25 



2767831 



Asp Ser Lys Tyr lie Asn Thr lie Tyr Met Asp Lys Gin Leu Arg Glu 
645 650 655 

Gly Met Leu lie Gin Ala Met Ser Arg Thr Asn Arg Thr Phe His Leu 
660 665 670 

Asn Ser Lys Pro His Gly Lys Val Arg Phe Tyr Arg Gin Gly Glu Gin 
675 680 685 

Met Lys Ser Phe Val Glu Asn Ala Leu Arg lie Tyr Thr Arg Gly Gly 
690 695 700 

Asn Asp Thr Leu Gin Gly Ala Asp Glu Asp Ser Lys Asn Glu Asp lie 
705 710 715 720 

Gin Ser Leu Glu Asp Glu His lie Leu Ala Glu Pro Gin Ser His Gin 
725 730 735 

lie Pro Lys Leu Thr Pro Ala Val Gin Glu Leu Lys Ala Phe Ala Gly 
740 745 750 

Glu Asp Phe Ser Gin lie Pro Arg Gly Glu Lys Asp Leu Lys Gin Phe 
755 760 765 

Val Arg Leu Gly Leu Glu Thr Gin Asn Gin lie Gin Gin Leu Val Gin 
770 775 780 

Gin Gly Tyr Glu Leu Gly Asn Glu lie Asp Leu Leu Asp Ala Gin Gly 
785 790 795 800 

Glu Ser Thr Gly Glu Lys Val Arg Leu Asp lie Ser Ser Phe Glu Glu 
805 810 815 

Phe Gly Ala Leu Gin Ala Arg Leu Asn Asp Ala Arg Glu Lys Leu Pro 
820 825 830 

Glu Glu Glu Arg Pro Asp Leu Thr Glu He Arg Val Gly Leu Ser Leu 
835 840 845 

Tyr Asp His Glu He He Asp Tyr Asp Trp Leu Val Asp Leu Leu Asn 
850 855 860 

Leu Phe Met Asp Gin Lys Thr Pro Glu Asn Lys Ala Ser He Glu Lys 
865 870 875 880 

His He Leu Pro Leu Asp Glu Met Ser Gin Gin Glu He Lys Asp He 
885 890 895 

He Val Asp He Glu Ser Gly Glu He Lys Glu His Phe Thr Lys Ala 
900 905 910 

Thr Leu Glu Asp Gin Arg Lys His Lys Arg Ser Asp Arg Gin Glu Leu 
915 920 925 

Lys He Arg Arg Trp Ala Ala Asn Gin Lys Val Asn Gly Asn Arg He 
930 935 940 
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Val Gin Ala Phe Asp Leu Phe Leu Pro Gly His Ser Leu Val Asp Asn 
945 950 955 960 

Ser Gin Leu Ser Ala Leu val Ser Glu He Glu Ala Glu Glu Asn Leu 
965 970 975 

Ser Phe Phe Gly Ala Ser Glu Phe Glu Thr Ala Leu Met Ser Phe Phe 
980 985 990 

Asn Ser Leu * 
995 

(2) INFORMATIONS POUR LA SEQ ID NO : 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3150 paires de bases 
<B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 39. .3116 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 3: 



TAAAAAATGG TGGCAACTAT GGAAATGAGG GGGATCAA ATG AGT CAT TCG GAA 53 

Met Ser His Ser Glu 
1 5 

CAA ATG ATT GAA AAC CAG TTC ATA GAG ATC TTA AGT GAG AAA GAA AAT 101 
Gin Met He Glu Asn Gin Phe He Gin He Leu Ser Glu Lys Glu Asn 
10 15 20 

CAG TGG ACT TAT CGT CCG GAC TTG AAG TCG GAA GAA GCA CTT TGC CAA 149 
Gin Trp Thr Tyr Arg Pro Asp Leu Lys Ser Glu Glu Ala Leu Cys Gin 
25 30 35 

AAC TTT AGA GGC CAT TTG AAC CGA ATA AAT TTA GCA GTA TTG GAA GAG 197 
Asn Phe Arg Gly His Leu Asn Arg He Asn Leu Ala Val Leu Glu Glu 
40 45 50 

CAA CTA TTA ACG GAC AAA GAA TTT AAG CAA GTC AAA GTC GAG TTT TCA 245 

-Gi n- Leu -Leu -Thr -Asp- Ly s -G lu- Phe -Lys-Gl-n-Val- Ly s -Va l— Glu— Phe- Ser — 

55 60 65 

CGT TTG ACC GGA ACA CCT TTT TTA GCT TCT CAA TGG CTT AGA GGA GAA 293 
Arg Leu Thr Gly Thr Pro Phe Leu Ala Ser Gin Trp Leu Arg Gly Glu 
70 75 80 85 

AAC GGG GTG GCT CAA GTT TTA TTA GAG CGA GAA GAT GGG GAA AAA GTG 341 
Asn Gly Val Ala Gin Val Leu Leu Glu Arg Glu Asp Gly Glu Lys Val 
90 95 100 

ACT TTA GAA GCC TTT AGA AAT AAG GAT ATC TCA GGA GGA ACT TCT TCT 389 
Thr Leu Glu Ala Phe Arg Asn Lys Asp He Ser Gly Gly Thr Ser Ser 
105 110 115 
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TAT GAG GTA GTT CAC CAA GTG GTC CCA GAT TCC TCT AGA GTA GAT CGT 437 
Tyr Glu Val Val His Gin Val Val Pro Asp Ser Ser Arg Val Asp Arg 
120 125 130 

GGA GAT GTG AGC TTG CTG ATT AAT GGG CTC CCA ATC ATT CAT ATT GAG 485 
Gly Asp Val Ser Leu Leu lie Asn Gly Leu Pro lie He His He Glu 
135 140 145 

CTC CAA AAA GAG TCC GCT AAA GAC GGT TTC ATG CAA GCT TAT TAT CAA 533 
Leu Gin Lys Glu Ser Ala Lys Asp Gly Phe Met Gin Ala Tyr Tyr Gin 
I 50 155 160 * 165 

ATT CAG CGT TAT GCA GAA GAT GGA TTT TTT AAA GGG ATT TAC GCA ACC 581 
He Gin Arg Tyr Ala Glu Asp Gly Phe Phe Lys Gly He Tyr Ala Thr 
170 175 180 

ACT CAA ATC ATG GTG ATT CCC AAT AAA GTC GAT ACC CGA TAC TTT GCA 629 
Thr Gin He Met Val He Pro Asn Lys Val Asp Thr Arg Tyr Phe Ala 
185 190 195 

AGA CCT AGT GAA GAT ACC GCT GAA GCC TAT GCT CGG ATG AAG AAG TTT 677 
Arg Pro Ser Glu Asp Thr Ala Glu Ala Tyr Ala Arg Met Lys Lys Phe 
200 205 210 

TTA TTT AAT TGG CGG ACT GAA GAC AAT CAA ACG GTT TCC GAT TTG TTT 725 
Leu Phe Asn Trp Arg Thr Glu Asp Asn Gin Thr Val Ser Asp Leu Phe 
215 220 225 

GAT TTT ACT CGT ACA GTT TTG CGG ATA CCC GAT GCC CAT GAA TTG ATT 773 
Asp Phe Thr Arg Thr Val Leu Arg He Pro Asp Ala His Glu Leu He 
230 235 240 245 

AGC CAA TAT ACC ATT CTC GTC GAT GAT CCA AAA AAT CCA AAA TTC CTC 821 
Ser Gin Tyr Thr He Leu Val Asp Asp Pro Lys Asn Pro Lys Phe Leu 
250 255 260 

ATG GCT TTA AGG CCT TAC CAA ATT CAT GCT ATT CGT AAG ATT CGT CCA 869 
Met Ala Leu Arg Pro Tyr Gin lie His Ala lie Arg Lys He Arg Pro 
265 270 275 

AAA GCG GCA CAG CAT GAA GGA GGA TTC ATT TGG CAT GCG ACA GGT TCA 917 
Lys Ala Ala Gin His Glu Gly Gly Phe He Trp His Ala Thr Gly Ser 
280 285 290 

GGA AAG ACC ATT ACC AGT TTT GTC GCA ACG AAA TTA TTA GCA CAA AAT 965 
Gly Lys Thr He Thr Ser Phe Val Ala Thr Lys Leu Leu Ala Gin Asn 
295 300 305 

GCG ATC GGT GTC GAT CGT ACG GTC ATG GTT GTT GAT AGA ACA GAC TTA 1013 
Ala He Gly Val Asp Arg Thr Val Met Val Val Asp Arg Thr Asp Leu 
3 1° 315 320 325 

GAT GCT CAA ACG CAG GAT GAG TTT ACG AAG TTT GCC TCG GAA TAC CAT 1061 
Asp Ala Gin Thr Gin Asp Glu Phe Thr Lys Phe Ala Ser Glu Tyr His 
330 335 340 
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ACC GGA. CAA ACG ACC GGA AAT TCG GTA GCC AAT ACT TTG ATT GTT GGG 1109 
Thr Gly Gin Thr Thr Gly Asn Ser Val Ala Asn Thr Leu lie Val Gly 
345 350 355 

ATC AAA AAT CAA AAA CAG TTG GCT CGA AAC CTC CTA TCA TCA AAA AAT 1157 
lie Lys Asn Gin Lys Gin Leu Ala Arg Asn Leu Leu Ser Ser Lys Asn 
360 365 370 

AAT AAT ACG ATT TTA GTG ACC ACG ATT CAA AAA CTC TCT GCG GCT ATG 1205 
Asn Asn Thr He Leu Val Thr Thr He Gin Lys Leu Ser Ala Ala Met 
375 380 385 

CGA AGT GCC CAA CAA GAG AGT GAA GAA AAA GGC TCG AAT CAA TTT GAG 1253 
Arg Ser Ala Gin Gin Glu Ser Glu Glu Lys Gly Ser Asn Gin Phe Glu 
390 395 400 405 

AAG CTG CGG CAA GAA CAT ATT GTT TTT ATT GTT GAT GAG GCT CAT CGT 1301 
Lys Leu Arg Gin Glu His He Val Phe He Val Asp Glu Ala His Arg 
410 415 420 

GCG GTT AGT GAT GAG GAA ATG AAA CGA ATT AAG AAA ATA TTA CCC AAT 1349 
Ala Val Ser Asp Glu Glu Met Lys Arg He Lys Lys He Leu Pro Asn 
425 430 435 

TCT ACC TGG TTT GGA TTA ACG GGG ACG CCT ATT TTT GAA GCA AAT AAA 13 97 

Ser Thr Trp Phe Gly Leu Thr Gly Thr Pro lie Phe Glu Ala Asn Lys 
440 445 450 

AAG CAA GAA AAT GGA ACC TTT GCC AGA ACG ACG AGC CAG CAA TAC GGG 1445 
Lys Gin Glu Asn Gly Thr Phe Ala Arg Thr Thr Ser Gin Gin Tyr Gly 
455 460 465 

CCA CTC CTT CAC TCC TAT ACA ACC AAA AAT GCC ATG GAT GAT GGG GCT 1493 
Pro Leu Leu His Ser Tyr Thr Thr Lys Asn Ala Met Asp Asp Gly Ala 
470 475 480 485 

GTG TTA GGC TTT CAA GTC GAG TAT CAT TCG CTG ATT TCA GAA GAG GAT 1541 
Val Leu Gly Phe Gin Val Glu Tyr His Ser Leu He Ser Glu Glu Asp 
490 495 500 

CTA GAG GTG ATT GTC ACC CAA CTC AAT AAA GGA AAG TTG CCA GGC GAT 1589 
Leu Glu Val He Val Thr Gin Leu Asn Lys Gly Lys Leu Pro Gly Asp 
505 510 515 

GCC CTC CAA CAA GAG GAA TTA TTG CCT GCG GAA CTT TAT GAA AAA GAT 1637 
Ala Leu Gin Gin Glu Glu Leu Leu Pro Ala Glu Leu Tyr Glu Lys Asp 
520 525 530 

GAA CAT ATT CGT ACC ATG TTA CAA AAA ATC TTT AAT CGG AGG AGT GTG 1685 
Glu His He Arg Thr Met Leu Gin Lys He Phe Asn Arg Arg Ser Val 
535 540 545 

GTC AAA AAG TTC AAG GTA AAG AAT GGT TTT CCT ACG ATG TCA GCC ATT 1733 
Val Lys Lys Phe Lys Val Lys Asn Gly Phe Pro Thr Met Ser Ala He 
550 555 560 565 
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CTT ACC ACT CAC TCG ATT GCT CAA GCC AAA CAT ATT TAC CGG ATT TTA 1781 
Leu Thr Thr His Ser lie Ala Gin Ala Lys His lie Tyr Arg lie Leu 
570 575 580 

AAG GAA ATG AAA GAT AAT GGG ACA CTC TTG AAT GGT CGA CAA TTT GAT 1829 
Lys Glu Met Lys Asp Asn Gly Thr Leu Leu Asn Gly Arg Gin Phe Asp 
585 590 595 

GAA CGT CAT CGA CTG ATT GAT AAA GAT TTC CCA AGA GTA GCT ATT ACC 1877 
Glu Arg His Arg Leu lie Asp Lys Asp Phe Pro Arg Val Ala lie Thr 
600 605 610 

TTC TCA ACC AAT CCG GAT CGA TTA GAA AAA AAT GAA CAA GAC GAT GAA 1925 
Phe Ser Thr Asn Pro Asp Arg Leu Glu Lys Asn Glu Gin Asp Asp Glu 
615 620 625 

TTA GTA GAG ATC ATG AAA GAG TAT GCG AAA CAG TTT GAT GCT TCT CCT 1973 
Leu Val Glu lie Met Lys Glu Tyr Ala Lys Gin Phe Asp Ala Ser Pro 
630 635 640 645 

TAT CAA GAT GAG AAA CTC TAC AAT CAA AAT ATT AAT AAA CGG TTG GCC 2021 
Tyr Gin Asp Glu Lys Leu Tyr Asn Gin Asn lie Asn Lys Arg Leu Ala 
650 655 660 

CGT AAG GAA AAG CAA TAT CAA TCG GAT GGT CAG TGG CTA GAT TTT GTT 2069 
Arg Lys Glu Lys Gin Tyr Gin Ser Asp Gly Gin Trp Leu Asp Phe Val 
665 670 675 

ATT GTT GTC GAT CGT TTA TTG ACA GGC TTT GAT TCT CCA GCG ATT CTA 2117 
He Val Val Asp Arg Leu Leu Thr Gly Phe Asp Ser Pro Ala He Leu 
680 685 690 

ACC CTA TAT ATT GAT CGA GAA ATG AAC TAT CAA AAG CTC CTT CAA GCG 2165 
Thr Leu Tyr He Asp Arg Glu Met Asn Tyr Gin Lys Leu Leu Gin Ala 
695 700 705 

TTC TCA AGA ACC AAC CGT ATT TAT ACA GGA AAA GAT TCT GGT TTG ATT 2213 
Phe Ser Arg Thr Asn Arg He Tyr Thr Gly Lys Asp Ser Gly Leu He 
710 715 720 725 

GTC TCT TTT AGA AAA CCC TTC ACC ATG AAA GAG AAT GTG CAA AAC ACG 2261 
Val Ser Phe Arg Lys Pro Phe Thr Met Lys Glu Asn Val Gin Asn Thr 
730 735 740 

TTT CGT CTA TTC TCA AAT GAA AAT CAA AAC TTT GAT CAA CTG ATT CCA 2309 
Phe Arg Leu Phe Ser Asn Glu Asn Gin Asn Phe Asp Gin Leu He Pro 
745 750 755 

AGA GAA TAT GAA GAA GTC AAA AAA GAA TTT ATC GAA TGT TCA ACA CTT 2357 
Arg Glu Tyr Glu Glu Val Lys Lys Glu Phe He Glu Cys Ser Thr Leu 
760 765 770 

TAT AAA CAA AGC GAA GCT GAC CTA TCG GAT AAT CCC CAC GAT CTT AAA 2405 
Tyr Lys Gin Ser Glu Ala Asp Leu Ser Asp Asn Pro His Asp Leu Lys 
775 780 785 
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ACG ATG ATT GCG CAA GTG AGT GCT TAT CAG AAG CTA GGT AAG AGT TAT 24 53 

Thr Met lie Ala Gin Val Ser Ala Tyr Gin Lys Leu Gly Lys Ser Tyr 
790 795 800 805 

AAA GCG TTC CGA AGC TAT GAT CAA TAC GAA GAG GAC TTT GAA GCA TTT 2501 
Lys Ala Phe Arg Ser Tyr Asp Gin Tyr Glu Glu Asp Phe Glu Ala Phe 
810 815 820 

TCA GAA GTG GTG GAG CAG TTG CCA CAA TAT CGA GGT AAA ACG GAA AAT 2549 
Ser Glu Val Val Glu Gin Leu Pro Gin Tyr Arg Gly Lys Thr Glu Asn 
825 830 835 

GTT AAA ACA AAG ATT AAA GAA ATG ATC GAG GAT GAG GAG CAT CCT GAG 2597 
Val Lys Thr Lys lie Lys Glu Met He Glu Asp Glu Glu His Pro Glu 
840 845 850 

GAG GAC TTC GAG AAG CTT TTA CAA GAG ATT GCT TTT TCT TCG CAG CTC 2645 
Glu Asp Phe Glu Lys Leu Leu Gin Glu He Ala Phe Ser Ser Gin Leu 
855 860 865 

AAT GCG ACA CAT AAA GAC GTC GTG GAT AGT TTT TAT ATT AAT CAA CTT 2693 
Asn Ala Thr His Lys Asp Val Val Asp Ser Phe Tyr He Asn Gin Leu 
870 875 880 885 

TTG AAA GCG ATC CAA TTA AAC GAA GCA GGG GCC GTT GAA AAA TTT GAA 2741 
Leu Lys Ala He Gin Leu Asn Glu Ala Gly Ala Val Glu Lys Phe Glu 
890 895 900 

AAA GAA ATC CAA CAA AAG GAT CCT CAA ATT CAA AAG ATG TAT CAC ACC 2789 
Lys Glu He Gin Gin Lys Asp Pro Gin He Gin Lys Met Tyr His Thr 
905 910 915 

TTG AAA GAT CAA CTC GTC AAT ACT ACT GAA GAG ATC GAT GTG GCT CAA 2837 
Leu Lys Asp Gin Leu Val Asn Thr Thr Glu Glu He Asp Val Ala Gin 
920 925 930 

TTA AAA GAG ACT TCG ATT CAA AAT GAA ATT CAA AGA CTA CTT CAA AAA 2885 
Leu Lys Glu Thr Ser He Gin Asn Glu He Gin Arg Leu Leu Gin Lys 
935 940 945 

GAA GCT GAA GAA TTT GGA TTA TCC TTC GAC TTT TTA CAG TCT GCA ATG 2933 
Glu Ala Glu Glu Phe Gly Leu Ser Phe Asp Phe Leu Gin Ser Ala Met 
950 955 960 965 



AAT GAA TAT CAA GGC GAT AAG AAA GCG ATC CCT TAT TTA ACC CAT TTA 2981 

Asn Glu Tyr Gin Gly Asp Lys Lys Ala He Pro Tyr Leu Thr His Leu 
970 975 980 

CTG GAT TCG ATG ACT CTT AGT AAA GAA GAG TTC GAA CCC AAA GCG GGT 3 02 9 

Leu Asp Ser Met Thr Leu Ser Lys Glu Glu Phe Glu Pro Lys Ala Gly 
985 990 995 

GAA AAA TAC AGA AGA AGA CCA AAA GTT TTA GAA GAA CGA CTA CGA CAA 3 077 

Glu Lys Tyr Arg Arg Arg Pro Lys Val Leu Glu Glu Arg Leu Arg Gin 
1000 1005 1010 
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AAC TTT GAA CAA ATT CAA AAA TGG AAA GAA GAA TTA TAA TGGCGACAGG 312 6 

Asn Phe Glu Gin He Gin Lys Trp Lys Glu Glu Leu * 
1015 1020 1025 

TTTAAATCAA CAACTATGGG CTTC 3150 

(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERI S T I QUES DE LA SEQUENCE: 

(A) LONGUEUR: 1026 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

<ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

Met Ser His Ser Glu Gin Met He Glu Asn Gin Phe He Gin He Leu 
15 10 15 

Ser Glu Lys Glu Asn Gin Trp Thr Tyr Arg Pro Asp Leu Lys Ser Glu 
20 25 30 

Glu Ala Leu Cys Gin Asn Phe Arg Gly His Leu Asn Arg He Asn Leu 
35 40 45 

Ala Val Leu Glu Glu Gin Leu Leu Thr Asp Lys Glu Phe Lys Gin Val 
50 55 60 

Lys Val Glu Phe Ser Arg Leu Thr Gly Thr Pro Phe Leu Ala Ser Gin 
65 70 75 80 

Trp Leu Arg Gly Glu Asn Gly Val Ala Gin Val Leu Leu Glu Arg Glu 
85 90 95 

Asp Gly Glu Lys Val Thr Leu Glu Ala Phe Arg Asn Lys Asp He Ser 
100 105 110 

. Gly Gly Thr Ser Ser Tyr Glu Val Val His Gin Val Val Pro Asp Ser 
115 120 125 

Ser Arg Val Asp Arg Gly Asp Val Ser Leu Leu He Asn Gly Leu Pro 
130 135 140 

He He His He Glu Leu Gin Lys Glu Ser Ala Lys Asp Gly Phe Met 
145 150 155 160 

Gin Ala Tyr Tyr Gin He Gin Arg Tyr Ala Glu Asp Gly Phe Phe Lys 
165 170 175 

Gly He Tyr Ala Thr Thr Gin He Met Val He Pro Asn Lys Val Asp 
180 185 190 

Thr Arg Tyr Phe Ala Arg Pro Ser Glu Asp Thr Ala Glu Ala Tyr Ala 
195 200 205 

Arg Met Lys Lys Phe Leu Phe Asn Trp Arg Thr Glu Asp Asn Gin Thr 
210 215 220 
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Val Ser Asp Leu Phe Asp Phe Thr Arg Thr Val Leu Arg lie Pro Asp 
225 230 235 240 

Ala His Glu Leu lie Ser Gin Tyr Thr lie Leu Val Asp Asp Pro Lys 
245 250 255 

Asn Pro Lys Phe Leu Met Ala Leu Arg Pro Tyr Gin lie His Ala He 
260 265 270 

Arg Lys He Arg Pro Lys Ala Ala Gin His Glu Gly Gly Phe He Trp 
275 280 285 

His Ala Thr Gly Ser Gly Lys Thr He Thr Ser Phe Val Ala Thr Lys 
290 295 300 

Leu Leu Ala Gin Asn Ala He Gly Val Asp Arg Thr Val Met Val Val 
305 310 315 320 

Asp Arg Thr Asp Leu Asp Ala Gin Thr Gin Asp Glu Phe Thr Lys Phe 
325 330 335 

Ala Ser Glu Tyr His Thr Gly Gin Thr Thr Gly Asn Ser Val Ala Asn 
340 345 350 

Thr Leu He Val Gly He Lys Asn Gin Lys Gin Leu Ala Arg Asn Leu 
355 360 365 

Leu Ser Ser Lys Asn Asn Asn Thr He Leu Val Thr Thr He Gin Lys 
370 375 380 

Leu Ser Ala Ala Met Arg Ser Ala Gin Gin Glu Ser Glu Glu Lys Gly 
385 390 395 400 

Ser Asn Gin Phe Glu Lys Leu Arg Gin Glu His He Val Phe He Val 
405 410 415 

Asp Glu Ala His Arg Ala Val Ser Asp Glu Glu Met Lys Arg He Lys 
420 425 430 

Lys He Leu Pro Asn Ser Thr Trp Phe Gly Leu Thr Gly Thr Pro He 
435 440 445 

Phe Glu Ala Asn Lys Lys Gin Glu Asn Gly Thr Phe Ala Arg Thr Thr 
450 455 " 46~0 

Ser Gin Gin Tyr Gly Pro Leu Leu His Ser Tyr Thr Thr Lys Asn Ala 
465 470 475 480 

Met Asp Asp Gly Ala Val Leu Gly Phe Gin Val Glu Tyr His Ser Leu 
485 490 495 

He Ser Glu Glu Asp Leu Glu Val He Val Thr Gin Leu Asn Lys Gly 
500 505 510 

Lys Leu Pro Gly Asp Ala Leu Gin Gin Glu Glu Leu Leu Pro Ala Glu 
515 520 525 
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Leu Tyr Glu Lys Asp Glu His lie Arg Thr Met Leu Gin Lys He Phe 
530 535 540 

Asn Arg Arg Ser Val Val Lys Lys Phe Lys Val Lys Asn Gly Phe Pro 
545 550 555 560 

Thr Met Ser Ala lie Leu Thr Thr His Ser He Ala Gin Ala Lys His 
565 570 575 

He Tyr Arg He Leu Lys Glu Met Lys Asp Asn Gly Thr Leu Leu Asn 
580 585 590 

Gly Arg Gin Phe Asp Glu Arg His Arg Leu He Asp Lys Asp Phe Pro 
595 600 605 

Arg Val Ala He Thr Phe Ser Thr Asn Pro Asp Arg Leu Glu Lys Asn 
610 615 620 

Glu Gin Asp Asp Glu Leu Val Glu He Met Lys Glu Tyr Ala Lys Gin 
625 630 635 640 

Phe Asp Ala Ser Pro Tyr Gin Asp Glu Lys Leu Tyr Asn Gin Asn He 
645 650 655 

Asn Lys Arg Leu Ala Arg Lys Glu Lys Gin Tyr Gin Ser Asp Gly Gin 
660 665 670 

Trp Leu Asp Phe Val He Val Val Asp Arg Leu Leu Thr Gly Phe Asp 
675 680 685 

Ser Pro Ala He Leu Thr Leu Tyr He Asp Arg Glu Met Asn Tyr Gin 
690 695 700 

Lys Leu Leu Gin Ala Phe Ser Arg Thr Asn Arg He Tyr Thr Gly Lys 
705 710 715 720 

Asp Ser Gly Leu He Val Ser Phe Arg Lys Pro Phe Thr Met Lys Glu 
725 730 735 

Asn Val Gin Asn Thr Phe Arg Leu Phe Ser Asn Glu Asn Gin Asn Phe 
740 745 750 

Asp Gin Leu He Pro Arg Glu Tyr Glu Glu Val Lys Lys Glu Phe He 
755 760 765 

Glu Cys Ser Thr Leu Tyr Lys Gin Ser Glu Ala Asp Leu Ser Asp Asn 
770 775 780 

Pro His Asp Leu Lys Thr Met He Ala Gin Val Ser Ala Tyr Gin Lys 
785 790 795 800 

Leu Gly Lys Ser Tyr Lys Ala Phe Arg Ser Tyr Asp Gin Tyr Glu Glu 
805 810 815 

Asp Phe Glu Ala Phe Ser Glu Val Val Glu Gin Leu Pro Gin Tyr Arg 
820 825 830 
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Gly Lys Thr Glu Asn Val Lys Thr Lys lie Lys Glu Met lie Glu Asp 
835 840 845 

Glu Glu His Pro Glu Glu Asp Phe Glu Lys Leu Leu Gin Glu lie Ala 
850 855 860 

Phe Ser Ser Gin Leu Asn Ala Thr His Lys Asp Val Val Asp Ser Phe 
865 870 875 880 

Tyr He Asn Gin Leu Leu Lys Ala He Gin Leu Asn Glu Ala Gly Ala 
885 890 895 

Val Glu Lys Phe Glu Lys Glu He Gin Gin Lys Asp Pro Gin He Gin 
900 905 910 

Lys Met Tyr His Thr Leu Lys Asp Gin Leu Val Asn Thr Thr Glu Glu 
915 920 925 

He Asp Val Ala Gin Leu Lys Glu Thr Ser He Gin Asn Glu He Gin 
930 935 940 

Arg Leu Leu Gin Lys Glu Ala Glu Glu Phe Gly Leu Ser Phe Asp Phe 
945 950 955 960 

Leu Gin Ser Ala Met Asn Glu Tyr Gin Gly Asp Lys Lys Ala He Pro 
965 970 975 

Tyr Leu Thr His Leu Leu Asp Ser Met Thr Leu Ser Lys Glu Glu Phe 
980 985 990 

Glu Pro Lys Ala Gly Glu Lys Tyr Arg Arg Arg Pro Lys Val Leu Glu 
995 1000 1005 

Glu Arg Leu Arg Gin Asn Phe Glu Gin He Gin Lys Trp Lys Glu Glu 
1010 1015 1020 

Leu * 
1025 

(2) INFORMATIONS POUR LA SEQ ID NO : 5: 

(i) CARACTER I STI QUE S DE LA SEQUENCE : 

(A) LONGUEUR: 1600 paires de bases 

(Bl TYPE7 "Wcleotlde 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

( ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT : 2 1. . 1568 

(D) AUTRES INFORMATIONS : /products "HsdM" 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

AGAAATAAGG AGCGAATAAA ATG GCA TTA TCA AAT GAA CAA AAA AAT AAA 50 

Met Ala Leu Ser Asn Glu Gin Lys Asn Lys 
15 10 
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ATG TGG GCC CTC TTA AAT CAA ACC CGA GGA CAG ATT GGT TTA ACC GCC 9 8 

Met Trp Ala Leu Leu Asn Gin Thr Arg Gly Gin He Gly Leu Thr Ala 
15 20 25 

TAT AAA GAC TAC ATT TTT GGC TTA CTA TTT TAT AAA TAT TTA TCA GAA 146 
Tyr Lys Asp Tyr He Phe Gly Leu Leu Phe Tyr Lys Tyr Leu Ser Glu 
30 35 40 

AAG GCC ACA CAA TGG CTG GGA GAA GTT TTA CGA GGA GAC ACT TGG GAA 194 
Lys Ala Thr Gin Trp Leu Gly Glu Val Leu Arg Gly Asp Thr Trp Glu 
45 50 55 

AAT GTT TAT GAT CAA GAT CCT GTA AGA GCC TTA GAC TAT ATG AAA CAA 242 
Asn Val Tyr Asp Gin Asp Pro Val Arg Ala Leu Asp Tyr Met Lys Gin 
60 65 70 

AAG CTC GGT TAT GCC ATC CAA CCG AAG GAA TTT TTT AAA GAT TGG GAA 290 
Lys Leu Gly Tyr Ala He Gin Pro Lys Glu Phe Phe Lys Asp Trp Glu 
75 80 85 90 

GCT GCC ATT CAT GAA GAA CGA TTT AAC ATT CCA ATG ATT TCA GAT ACA 338 
Ala Ala He His Glu Glu Arg Phe Asn He Pro Met He Ser Asp Thr 
95 100 105 

TTT GGC CAT TTT AAT CAG CAA ATT GCT TTT GAA GCT AAA GAT GAT TTT 386 
Phe Gly His Phe Asn Gin Gin He Ala Phe Glu Ala Lys Asp Asp Phe 
110 115 120 

GAA GGC ATC TTT GAT GGG ATG CGT TTT GAT AGT TCA GAT TTA GGA AGT 434 
Glu Gly He Phe Asp Gly Met Arg Phe Asp Ser Ser Asp Leu Gly Ser 
125 130 135 

AAT GCG CAA GCT CGA GCA AGT GTG ATG ATC TCG ATG ATT GAG TTA CTC 482 
Asn Ala Gin Ala Arg Ala Ser Val Met He Ser Met He Glu Leu Leu 
140 145 150 

TCT GCC CCT GAG TTT GAT CTC TCT ACA GGA GGG GAC ACC GTT TCA GAT 530 
Ser Ala Pro Glu Phe Asp Leu Ser Thr Gly Gly Asp Thr Val Ser Asp 
155 160 165 170 

ATC TAC GAA TAC TTG TTA GAA AAG TTT GCG ACC GTA TTG GCC TCA GAC 578 
He Tyr Glu Tyr Leu Leu Glu Lys Phe Ala Thr Val Leu Ala Ser Asp 
175 180 185 

ATG GGA CAA TAC TAT ACT CCC AAA GAA ATT TCA GAG GTC ATG GCT CGT 626 
Met Gly Gin Tyr Tyr Thr Pro Lys Glu He Ser Glu Val Met Ala Arg 
190 195 200 

ATT TTG ACT TTT GGT AAA GCC GAC GAA GAC AAT TTT TCT ATT TAT GAT 674 
He Leu Thr Phe Gly Lys Ala Asp Glu Asp Asn Phe Ser He Tyr Asp 
205 210 215 

CCC GCG GTC GGT TCA GCT TCT CTC TTA ATT ACT ACC GCC AGT CAT ATG 722 
Pro Ala Val Gly Ser Ala Ser Leu Leu lie Thr Thr Ala Ser His Met 
220 225 230 
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AAA CAT TCC AAT CAA AGG GGA GCG ATT AAA TAC TTT GGT CAA GAA AAA 770 

Lys His Ser Asn Gin Arg Gly Ala lie Lys Tyr Phe Gly Gin Glu Lys 
235 240 245 250 

GAT GCC ACC CCT TAC CGA TTG GCT CGA ATG AAT TTA ATG ATG CAT AAC 818 

Asp Ala Thr Pro Tyr Arg Leu Ala Arg Met Asn Leu Met Met His Asn 

255 260 265 

ATT GAA TAC AAT GAT ATT CAG ATC CAT CAT GCG GAT ACT TTG GAA AGC 866 

lie Glu Tyr Asn Asp He Gin He His His Ala Asp Thr Leu >Glu Ser 
270 275 280 

GAT TGG CCT GAC GGA GTC ATT GAA GGG AAA GAT ACG CCT CGA ATG TTT 914 

Asp Trp Pro Asp Gly Val lie Glu Gly Lys Asp Thr Pro Arg Met Phe 
285 290 295 

GAC GCA GTG ATG GCT AAT CCA CCT TAT TCT GCC CAT TGG AAT AAT AAG 962 

Asp Ala Val Met Ala Asn Pro Pro Tyr Ser Ala His Trp Asn Asn Lys 
300 305 310 

GAT CGG GAA GAT GAC CCT CGA TTT CGT GAA TAT GGC ATT GCG CCA AAA 1010 

Asp Arg Glu Asp Asp Pro Arg Phe Arg Glu Tyr Gly He Ala Pro Lys 
315 320 325 330 

ACT AAA GCG GAC TAT TCT TTC TTG TTG CAT TGT TTG TAC CAT ACC AAA 1058 

Thr Lys Ala Asp Tyr Ser Phe Leu Leu His Cys Leu Tyr His Thr Lys 

335 340 345 

GAG AGT GGC CGT GTG GCC ATT ATT CTC CCA CAC GGG GTC TTG TTT AGA 1106 

Glu Ser Gly Arg Val Ala He He Leu Pro His Gly Val Leu Phe Arg 
350 355 360 

GGC GCT GCG GAA GGA CGG ATT CGA AAA GCT TTG ATT GAT AAA CAT CAA 1154 

Gly Ala Ala Glu Gly Arg He Arg Lys Ala Leu He Asp Lys His Gin 
365 370 375 

ATT GAA GCG GTA ATT GGT TTT CCA GAT AAA CTC TTT TTG AAC ACA GGC 12 02 

He Glu Ala Val He Gly Phe Pro Asp Lys Leu Phe Leu Asn Thr Gly 
380 385 390 

ATT CCC GTT TGT GTC TTA ATT CTT AAA AAG AAT CGA GCA AAC TCT GAT 1250 

He Pro Val Cys Val Leu He Leu Lys Lys Asn Arg Ala Asn Ser Asp 
395 400 405 410 



ATT CTT TTT GTG GAC GCC AGT CAA GGC TTT GAA AAG ATG AAG AAT CAA 1298 
He Leu Phe Val Asp Ala Ser Gin Gly Phe Glu Lys Met Lys Asn Gin 
415 420 425 

AAA CAA TTG CGC CCA GAA GAT ATT GAC AAG ATC ACT GAA ACA GTC ATT 1346 
Lys Gin Leu Arg Pro Glu Asp He Asp Lys He Thr Glu Thr Val He 
430 435 440 

CAT CGC AAG GCG GTT GAT AAA TAT AGC CAC TTA GCA ACG CTT GAG GAA 13 94 

His Arg Lys Ala Val Asp Lys Tyr Ser His Leu Ala Thr Leu Glu Glu 
445 450 455 
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GTC ATT GAG AAT GAT TAC AAC TTA AAT ATT CCG CGT TAT GTG GAT ACC 1442 
Val lie Glu Asn Asp Tyr Asn Leu Asn lie Pro Arg Tyr Val Asp Thr 
460 465 470 

TTT GAA GAG GAA GAA TCG ATT GAC TTA GCG GAT ATT CAA GGT CAA ATA 1490 
Phe Glu Glu Glu Glu Ser lie Asp Leu Ala Asp lie Gin Gly Gin lie 
475 480 485 490 

GAT GAA GTA GAC GCA GAG ATT GCG AAA GCT AAT CAA ACC TTA GCA AAC 1538 
Asp Glu Val Asp Ala Glu lie Ala Lys Ala Asn Gin Thr Leu Ala Asn 
495 500 505 

TAC TTT AAG GAA CTG GGA GTG CTA AAA TGA AGGAAAGATT AAAGGCTCCA 1588 
Tyr Phe Lys Glu Leu Gly Val Leu Lys * 
510 515 

GAATTAAGGT TT 1600 

(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERI STI QUES DE LA SEQUENCE: 

(A) LONGUEUR: 516 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 

Met Ala Leu Ser Asn Glu Gin Lys Asn Lys Met Trp Ala Leu Leu Asn 
15 10 15 

Gin Thr Arg Gly Gin lie Gly Leu Thr Ala Tyr Lys Asp Tyr lie Phe 
20 25 30 

Gly Leu Leu Phe Tyr Lys Tyr Leu Ser Glu Lys Ala Thr Gin Trp Leu 
35 40 45 

Gly Glu Val Leu Arg Gly Asp Thr Trp Glu Asn Val Tyr Asp Gin Asp 
50 55 60 

Pro Val Arg Ala Leu Asp Tyr Met Lys Gin Lys Leu Gly Tyr Ala He 
65 70 75 80 

Gin Pro Lys Glu Phe Phe Lys Asp Trp Glu Ala Ala He His Glu Glu 
85 90 95 

Arg Phe Asn He Pro Met He Ser Asp Thr Phe Gly His Phe Asn Gin 
100 105 110 

Gin He Ala Phe Glu Ala Lys Asp Asp Phe Glu Gly He Phe Asp Gly 
115 120 125 

Met Arg Phe Asp Ser Ser Asp Leu Gly Ser Asn Ala Gin Ala Arg Ala 
130 135 140 

Ser Val Met He Ser Met He Glu Leu Leu Ser Ala Pro Glu Phe Asp 
145 150 155 160 
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Leu Ser Thr Gly Gly Asp Thr Val Ser Asp He Tyr Glu Tyr Leu Leu 
165 170 ~ 175 

Glu Lys Phe Ala Thr Val Leu Ala Ser Asp Met Gly Gin Tyr Tyr Thr 
180 185 ^ 190 

Pro Lys Glu He Ser Glu Val Met Ala Arg He Leu Thr Phe Gly Lys 
19 5 200 205 

Ala Asp Glu Asp Asn Phe Ser He Tyr Asp Pro Ala Val Gly Ser Ala 
21° 215 220 

Ser Leu Leu He Thr Thr Ala Ser His Met Lys His Ser Asn Gin Arg 
225 230 235 240 

Gly Ala He Lys Tyr Phe Gly Gin Glu Lys Asp Ala Thr Pro Tyr Arg 
245 250 255 

Leu Ala Arg Met Asn Leu Met Met His Asn He Glu Tyr Asn Asp He 
260 265 270 

Gin He His His Ala Asp Thr Leu Glu Ser Asp Trp Pro Asp Gly Val 
275 280 285 

He Glu Gly Lys Asp Thr Pro Arg Met Phe Asp Ala Val Met Ala Asn 
2^0 295 300 

Pro Pro Tyr Ser Ala His Trp Asn Asn Lys Asp Arg Glu Asp Asp Pro 
305 310 ' 315 320 

Arg Phe Arg Glu Tyr Gly He Ala Pro Lys Thr Lys Ala Asp Tyr Ser 
325 330 335 

Phe Leu Leu His Cys Leu Tyr His Thr Lys Glu Ser Gly Arg Val Ala 
340 345 " 350 

He He Leu Pro His Gly Val Leu Phe Arg Gly Ala Ala Glu Gly Arg 
355 360 365 

He Arg Lys Ala Leu He Asp Lys His Gin He Glu Ala Val He Gly 
370 375 380 

Phe Pro Asp Lys Leu Phe Leu Asn Thr Gly He Pro Val Cys Val Leu 
3„ 85 390 395 40Q 

He Leu Lys Lys Asn Arg Ala Asn Ser Asp He Leu Phe Val Asp Ala 
405 410 415 

Ser Gin Gly Phe Glu Lys Met Lys Asn Gin Lys Gin Leu Arg Pro Glu 
420 425 430 

Asp He Asp Lys He Thr Glu Thr Val He His Arg Lys Ala Val Asp 
435 440 445 

Lys Tyr Ser His Leu Ala Thr Leu Glu Glu Val He Glu Asn Asp Tyr 
450 455 460 
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Asn Leu Asn He Pro Arg Tyr Val Asp Thr Phe Glu Glu Glu Glu Ser 
465 470 475 480 

He Asp Leu Ala Asp He Gin Gly Gin He Asp Glu Val Asp Ala Glu 
485 490 495 

He Ala Lys Ala Asn Gin Thr Leu Ala Asn Tyr Phe Lys Glu Leu Gly 
500 505 510 

Val Leu Lys * 
515 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 1700 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 4 8. .1661 

(D) AUTRES INFORMATIONS: /product^ "hdsM" 
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 7: 

AAAGTTTTAG AAGAACGACT ACGACAAAAC TTTGAACAAA TTCAAAA ATG GAA AGA 56 

Met Glu Arg 
1 

AGA ATT ATA ATG GCG AGA GGT TTA AAT CAA CAA CTA TGG GCT TCT GCG 104 
Arg He He Met Ala Thr Gly Leu Asn Gin Gin Leu Trp Ala Ser Ala 
5 10 15 

GAT ATC TTA CGT GGG AAG ATG GAT GCA AGT GAG TAC AAA AAC TAT TTA 152 
Asp He Leu Arg Gly Lys Met Asp Ala Ser Glu Tyr Lys Asn Tyr Leu 
20 25 30 35 

CTG GGA TTA ATT TTC TAT AAG TAC TTG TCT GAT GCG CAG CTG AGA GAA 200 
Leu Gly Leu He Phe Tyr Lys Tyr Leu Ser Asp Ala Gin Leu Arg Glu 
40 45 50 

GTT TAT GAA CAA GAA AAT GGG AAG ACA GAT ACC TTC CCA GAA CGT TCC 24 8 

Val Tyr Glu Gin Glu Asn Gly Lys Thr Asp Thr Phe Pro Glu Arg Ser 
55 60 65 

ACT CAG TAT GCA GGC TTC ATG GAA TGG TAC GAA GAA GAC AAA GAC GAT 296 
Thr Gin Tyr Ala Gly Phe Met Glu Trp Tyr Glu Glu Asp Lys Asp Asp 
70 75 80 

TTA ATC GAA AAT ATC CAA CCC AAA CAA GGT TAC TTT ATC CAA CCC GAT 344 
Leu He Glu Asn He Gin Pro Lys Gin Gly Tyr Phe He Gin Pro Asp 
85 90 95 

CAA TTG TTT TAT AGT TAC CGC ATC AAA GCA GAC AAC TAT GAA TTT AAT 392 
Gin Leu Phe Tyr Ser Tyr Arg He Lys Ala Asp Asn Tyr Glu Phe Asn 
100 105 110 115 
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TTG ACC GAT TTA CAA GCA GGT TTT AAT GAG TTG GAA CGT CAA GGA GAA 440 
Leu Thr Asp Leu Gin Ala Gly Phe Asn Glu Leu Glu Arg Gin Gly Glu 
120 125 " 130 

GAA TTC AGT GGA TTG TTT GCG GAC ATT GAT TTA AAC TCC ACA AAA TTA 4 88 

Glu Phe Ser Gly Leu Phe Ala Asp lie Asp Leu Asn Ser Thr Lys Leu 
135 140 145 

GGA TCA AAT GCA CTA CTA CGT AAT GTG ACG ATC ACT GAG GTT TTG CGT 536 
Gly Ser Asn Ala Leu Leu Arg Asn Val Thr lie Thr Glu Val Leu Arg 
150 155 160 

GCC TTA GAT GAG ATT GAT TTA TTT GAA CAC AAT GGC GAT GTG ATT GGG 584 
Ala Leu Asp Glu lie Asp Leu Phe Glu His Asn Gly Asp Val lie Gly 
165 170 175 

GAC GCT TAT GAG TAT TTG ATT GGA GAA TTC GCG TCA AGT GCA GGT AAA 632 
Asp Ala Tyr Glu Tyr Leu lie Gly Glu Phe Ala Ser Ser Ala Gly Lys 
180 185 190 195 

AAA GCC GGT GAG TTT TAT ACG CCT CAA GCT GTT TCG AAA ATC ATG TCA 680 
Lys Ala Gly Glu Phe Tyr Thr Pro Gin Ala Val Ser Lys He Met Ser 
200 205 210 

GAA ATT ACG TCG ATT GGA CAA GAA ACC CGT GCG CCT TTT CAT ATT TAT 728 
Glu He Thr Ser He Gly Gin Glu Thr Arg Ala Pro Phe His He Tyr 
215 220 225 

GAT CCT GCG ATG GGG TCA GGT TCT TTG ATG CTT AAT ATC CGT CGG TAT 776 
Asp Pro Ala Met Gly Ser Gly Ser Leu Met Leu Asn He Arg Arg Tyr 
230 235 240 

CTC AAT AAT CCA GAT CAA GTG CAC TAT CAT GGA CAA GAG TTA AAT ACG 824 
Leu Asn Asn Pro Asp Gin Val His Tyr His Gly Gin Glu Leu Asn Thr 
245 250 255 

ACG ACC TTT AAC TTA GCA CGT ATG AAC TTA ATT CTT CAT GGA ATA GAT 872 
Thr Thr Phe Asn Leu Ala Arg Met Asn Leu He Leu His Gly He Asp 
260 265 270 275 

AAA GAA CGC ATG AAC CTG AAT AAC GGA GAT ACT TTA GAT GCC GAT TGG 920 
Lys Glu Arg Met Asn Leu Asn Asn Gly Asp Thr Leu Asp Ala Asp Trp 
280 285 290 

CCC TCA GAA GAA CCG TAT CAG TTT GAT TCC GTA TGC ATG AAC CCT CCT 968 
Pro Ser Glu Glu Pro Tyr Gin Phe Asp Ser Val Cys Met Asn Pro Pro 
295 300 305 

TAT TCT GCG AAA TGG TCA GCG GCA GAT CAA TTT CTC TCT GAC CCT CGT 1016 
Tyr Ser Ala Lys Trp Ser Ala Ala Asp Gin Phe Leu Ser Asp Pro Arg 
310 315 320 

TTT GAG CGT TTT GGA AAA TTA GCG CCT AAA TCT AAA GCG GAC TTT GCC 1064 
Phe Glu Arg Phe Gly Lys Leu Ala Pro Lys Ser Lys Ala Asp Phe Ala 
325 330 335 
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TTT CTC CTT CAC GGT TTT TAC CAT TTG AAA GAA TCG GGA ACA ATG GGG 1112 
Phe Leu Leu His Gly Phe Tyr His Leu Lys Glu Ser Gly Thr Met Gly 
340 345 350 355 

ATT GTC CTG CCT CAT GGC GTT CTC TTT AGA GGA GCC GCG GAA GGA ACC 1160 
He Val Leu Pro His Gly Val Leu Phe Arg Gly Ala Ala Glu Gly Thr 
360 365 370 

ATC CGT CAA GCC CTT TTA GAA ATG GGA GCT ATT GAT GCG GTC ATT GGC 1208 
He Arg Gin Ala Leu Leu Glu Met Gly Ala He Asp Ala Val He Gly 
375 380 385 

TTG CCG GCC AAT ATC TTT TTT GGA ACG AGT ATT CCG ACA ACG GTT ATT 1256 
Leu Pro Ala Asn He Phe Phe Gly Thr Ser He Pro Thr Thr Val He 
390 395 400 

ATT TTG AAG AGA AAC CGC TCT CGT CGT GAT GTC TTA TTT ATC GAT GCT 1304 
He Leu Lys Arg Asn Arg Ser Arg Arg Asp Val Leu Phe He Asp Ala 
405 410 415 

TCT CAA GAC TTT GAA AAA CGA AAA AAT CAA AAT GTC CTG TTG GAT GAA 1352 
Ser Gin Asp Phe Glu Lys Arg Lys Asn Gin Asn Val Leu Leu Asp Glu 
420 425 430 435 

CAT ATT GAT AAA ATT GTT TCT ATC CAC AAA AAA CGA GAA GAT ATT GAA 1400 
His He Asp Lys He Val Ser He His Lys Lys Arg Glu Asp He Glu 
440 445 450 

AGA TAT GCT CAT GTT GCA AGT TTT GAT GAG ATC CAA GAA AAT GAC TTT 1448 
Arg Tyr Ala His Val Ala Ser Phe Asp Glu He Gin Glu Asn Asp Phe 
455 460 465 

AAC TTA AAT ATC CCT CGT TAT GTA GAT ACC TTT GAG GAA GAG GAA CCG 1496 
Asn Leu Asn He Pro Arg Tyr Val Asp Thr Phe Glu Glu Glu Glu Pro 
470 475 480 

GTT GAT TTG GTT GCA GTA AAT ACC AAT CTC CTT AAG ATC AAT GAA GAA 1544 
• Val Asp Leu Val Ala Val Asn Thr Asn Leu Leu Lys He Asn Glu Glu 
485 490 495 

TTA GTT CAA CAA GAG CAA GTG CTC TTA TCG ATG ATT GAC AAT TTT GCA 1592 
Leu Val Gin Gin Glu Gin Val Leu Leu Ser Met He Asp Asn Phe Ala 
500 505 510 515 

GAA AGT GAA GAG AAT CAA GCC TTG ATT GAA TCG ATG CGT CTT CTT TTG 1640 
Glu Ser Glu Glu Asn Gin Ala Leu He Glu Ser Met Arg Leu Leu Leu 
520 525 530 

AGA GGC GGT CAT GAT GAG TAA AAAGAGTCCA CAATTAAGGT TTGAAGGTTT 1691 
Arg Gly Gly His Asp Glu * 
535 

TACGGATGA 1700 
(2) INFORMATIONS POUR LA SEQ ID NO: 8: 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 53 8 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

Met Glu Arg Arg lie lie Met Ala Thr Gly Leu Asn Gin Gin Leu Trp 
15 10 15 

Ala Ser Ala Asp lie Leu Arg Gly Lys Met Asp Ala Ser Glu Tyr Lys 
20 25 30 

Asn Tyr Leu Leu Gly Leu lie Phe Tyr Lys Tyr Leu Ser Asp Ala Gin 
35 40 45 

Leu Arg Glu Val Tyr Glu Gin Glu Asn Gly Lys Thr Asp Thr Phe Pro 
50 55 60 

Glu Arg Ser Thr Gin Tyr Ala Gly Phe Met Glu Trp Tyr Glu Glu Asp 
65 70 75 80 

Lys Asp Asp Leu lie Glu Asn lie Gin Pro Lys Gin Gly Tyr Phe lie 
85 90 95 

Gin Pro Asp Gin Leu Phe Tyr Ser Tyr Arg lie Lys Ala Asp Asn Tyr 
100 105 110 

Glu Phe Asn Leu Thr Asp Leu Gin Ala Gly Phe Asn Glu Leu Glu Arg 
115 120 125 

Gin Gly Glu Glu Phe Ser Gly Leu Phe Ala Asp He Asp Leu Asn Ser 
130 135 140 

Thr Lys Leu Gly Ser Asn Ala Leu Leu Arg Asn Val Thr He Thr Glu 
145 150 155 160 

Val Leu Arg Ala Leu Asp Glu He Asp Leu Phe Glu His Asn Gly Asp 
165 170 175 

Val He Gly Asp Ala Tyr Glu Tyr Leu He Gly Glu Phe Ala Ser Ser 
180 185 190 



Ala Gly Lys Lys Ala Gly Glu Phe Tyr Thr Pro Gin Ala Val Ser Lys 
195 200 205 

He Met Ser Glu He Thr Ser He Gly Gin Glu Thr Arg Ala Pro Phe 
210 215 220 

His He Tyr Asp Pro Ala Met Gly Ser Gly Ser Leu Met Leu Asn He 
22 5 230 235 240 

Arg Arg Tyr Leu Asn Asn Pro Asp Gin Val His Tyr His Gly Gin Glu 
245 250 255 

Leu Asn Thr Thr Thr Phe Asn Leu Ala Arg Met Asn Leu He Leu His 
260 265 270 
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Gly lie Asp Lys Glu Arg Met Asn Leu Asn Asn Gly Asp Thr Leu Asp 
275 280 285 

Ala Asp Trp Pro Ser Glu Glu Pro Tyr Gin Phe Asp Ser Val Cys Met 
290 295 300 

Asn Pro Pro Tyr Ser Ala Lys Trp Ser Ala Ala Asp Gin Phe Leu Ser 
305 310 315 320 

Asp Pro Arg Phe Glu Arg Phe Gly Lys Leu Ala Pro Lys Ser Lys Ala 
325 330 335 

Asp Phe Ala Phe Leu Leu His Gly Phe Tyr His Leu Lys Glu Ser Gly 
340 345 350 

Thr Met Gly lie Val Leu Pro His Gly Val Leu Phe Arg Gly Ala Ala 
355 360 365 

Glu Gly Thr He Arg Gin Ala Leu Leu Glu Met Gly Ala He Asp Ala 
370 375 380 

Val lie Gly Leu Pro Ala Asn lie Phe Phe Gly Thr Ser He Pro Thr 
385 390 395 400 

Thr Val lie He Leu Lys Arg Asn Arg Ser Arg Arg Asp Val Leu Phe 
405 410 415 

He Asp Ala Ser Gin Asp Phe Glu Lys Arg Lys Asn Gin Asn Val Leu 
420 425 430 

Leu Asp Glu His He Asp Lys He Val Ser He His Lys Lys Arg Glu 
435 440 445 

Asp He Glu Arg Tyr Ala His Val Ala Ser Phe Asp Glu He Gin Glu 
450 455 460 

Asn Asp Phe Asn Leu Asn He Pro Arg Tyr Val Asp Thr Phe Glu Glu 
- 465 470 475 480 

Glu Glu Pro Val Asp Leu Val Ala Val Asn Thr Asn Leu Leu Lys He 
485 490 495 

Asn Glu Glu Leu Val Gin Gin Glu Gin Val Leu Leu Ser Met He Asp 
500 505 510 

Asn Phe Ala Glu Ser Glu Glu Asn Gin Ala Leu He Glu Ser Met Arg 
515 520 525 

Leu Leu Leu Arg Gly Gly His Asp Glu * 
530 535 

(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1400 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION : lineaire 
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(ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 15. .1385 

(D) AUTRE S INFORMATIONS :/product= "HsdS" 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 9: 



CTGGGAGTGC TAAA ATG AAG GAA AGA TTA AAG GCT CCA GAA TTA AGG TTT 50 
Met Lys Glu Arg Leu Lys Ala Pro Glu Leu Arg Phe 
15 10 

GAT GGT TTT ACG GAT GAT TGG GAA GAG CGT AAG TTA TTA GAC AAT GTA 98 
Asp Gly Phe Thr Asp Asp Trp Glu Glu Arg Lys Leu Leu Asp Asn Val 
15 20 25 

GAA AAA GTA TTA CAT TAT CGT GGT AAA AGC CCC GCT AAG TTT GGA ATG 146 
Glu Lys Val Leu His Tyr Arg Gly Lys Ser Pro Ala Lys Phe Gly Met 
30 35 40 

GAA TGG GGT ACA GAA GGT TAT CTT GTT CTT TCT GCT TTG AAT GTT AAA 194 
Glu Trp Gly Thr Glu Gly Tyr Leu Val Leu Ser Ala Leu Asn Val Lys 
45 50 55 60 

AAT GGA TAC ATT GAT AAA TCT GTT GAA GCA AAG TAT GGG GAT CAT GAA 242 
Asn Gly Tyr lie Asp Lys Ser Val Glu Ala Lys Tyr Gly Asp His Glu 
65 70 75 

TTA TTT GAC AGA TGG ATG GGG AAC AAT CGG TTA GAA AAA GGA GAT GTT 290 
Leu Phe Asp Arg Trp Met Gly Asn Asn Arg Leu Glu Lys Gly Asp Val 
80 85 90 

GTT TTT ACA ACA GAA GCT CCT TTA GGC AAT GTA GCT CAA GTA CCC GAT 338 
Val Phe Thr Thr Glu Ala Pro Leu Gly Asn Val Ala Gin Val Pro Asp 
95 100 105 

AAT AAC GGA TAT ATA TTA AAC CAA AGA GCG GTT GCA TTT AAA TCT TTG 386 
Asn Asn Gly Tyr lie Leu Asn Gin Arg Ala Val Ala Phe Lys Ser Leu 
110 lis 120 

CAA GAA ACA GAT GAT AAT TTC TTT GCG CAA TTA CTA CGA AGT CCT ATT 4 34 

Gin Glu Thr Asp Asp Asn Phe Phe Ala Gin Leu Leu Arg Ser Pro He 
125 130 135 140 

~GTT ^ZAA-AAT ACA" TTA AAA" GCT AGT TCT TCT GGG GGA~ ACT GCC AAA GGT 482" 

Val Gin Asn Thr Leu Lys Ala Ser Ser Ser Gly Gly Thr Ala Lys Gly 
145 150 155 

ATT GGA ATG AAA GAA TTT GCT AAA CTT AAT GCT CGA GTT CCC GAA ACA 530 
He Gly Met Lys Glu Phe Ala Lys Leu Asn Ala Arg Val Pro Glu Thr 
160 165 170 

CAT GAA GAA CAA CGA AAA ATA GGG TTA TTC TTC AAA GAG CTA GAC GAC 578 
His Glu Glu Gin Arg Lys He Gly Leu Phe Phe Lys Gin Leu Asp Asp 
175 180 185 

ACT ATC GTT CTT CAT CAA CGT AAG TTA GAT CTT CTC AAA GAG CAG AAA 626 
Thr He Val Leu His Gin Arg Lys Leu Asp Leu Leu Lys Glu Gin Lys 
190 195 200 
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AAA GGA TAG TTG CAA AAA ATG TTC CCC AAA AAT GGT TCA AAA ATT CCT 674 
Lys Gly Tyr Leu Gin Lys Met Phe Pro Lys Asn Gly Ser Lys lie Pro 
205 210 215 220 

GAA TTG AGA TTT GCG GAG TTT GCT GAC GAT TGG GAA GAA CGT AAG TTG 722 
Glu Leu Arg Phe Ala Glu Phe Ala Asp Asp Trp Glu Glu Arg Lys Leu 
225 230 235 

GGT GAA GTT GCA ACA TTT CTA AAC GGA CGA GCA TAT AAG CAA GAT GAA 770 
Gly Glu Val Ala Thr Phe Leu Asn Gly Arg Ala Tyr Lys Gin Asp Glu 
240 245 250 

TTA CTG GAT TCA GGT AAA TAT AAA GTG CTT CGC GTC GGC AAT TTT TAT 818 
Leu Leu Asp Ser Gly Lys Tyr Lys Val Leu Arg Val Gly Asn Phe Tyr 
255 260 265 

ACC AAT GAT TCT TGG TAC TAC TCT AAT ATG GAG CTT GGT GAT AAA TAT 866 
Thr Asn Asp Ser Trp Tyr Tyr Ser Asn Met Glu Leu Gly Asp Lys Tyr 
270 275 280 

TAT GTT GAT AAA GGT GAT CTA GTT TAT ACT TGG TCA GCG ACA TTT GGC 914 
Tyr Val Asp Lys Gly Asp Leu Val Tyr Thr Trp Ser Ala Thr Phe Gly 
285 290 295 300 

CCA CAT ATT TGG AGT GGC GAA AAA GTT ATT TAC CAT TAT CAC ATC TGG 962 
Pro His lie Trp Ser Gly Glu Lys Val He Tyr His Tyr His He Trp 
305 310 315 

AAA GTC GAG CTT TCT AAA TTT CTT GAT AGO AAT TTT ACA TTG CAA CTT 1010 
Lys Val Glu Leu Ser Lys Phe Leu Asp Arg Asn Phe Thr Leu Gin Leu 
320 325 330 

TTA GAA GCG GAT AAA GCA AGA TTG TTA TCC AGT ACA AAT GGT TCA ACA 1058 
Leu Glu Ala Asp Lys Ala Arg Leu Leu Ser Ser Thr Asn Gly Ser Thr 
335 340 345 

ATG ATT CAT GTA ACC AAG GGA GAT ATG GAA AGT AAA ATT GTT TCT ATT 1106 
Met He His Val Thr Lys Gly Asp Met Glu Ser Lys lie Val Ser He 
350 355 360 

CCT AAT ATT GAT GAG CAA AAA CAA ATT GGT TCA TTC TTC AAA CAA CTC 1154 
Pro Asn He Asp Glu Gin Lys Gin He Gly Ser Phe Phe Lys Gin Leu 
365 370 375 380 

GAC AAC ACT ATC ACC CTT CAT CAA CGT AAG TTA GAT TTG TTG AAA GAG 1202 
Asp Asn Thr He Thr Leu His Gin Arg Lys Leu Asp Leu Leu Lys Glu 
385 390 395 

CAG AAA AAA GGA TTT CTA CAA AAA ATG TTT CAT TTA ACA AAT TTA GGA 1250 
Gin Lys Lys Gly Phe Leu Gin Lys Met Phe His Leu Thr Asn Leu Gly 
400 405 410 

GCC TTC ACT ATG GAA ACT ATA CAA AAA TAT TTA AAG ATA ATT GTT GAA 1298 
Ala Phe Thr Met Glu Thr He Gin Lys Tyr Leu Lys He He Val Glu 
415 420 425 
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AGT AAT TAT CTT CAT CAA CGT AAG TTA GAC TTG CTT AAG GAG CAA AAA 
Ser Asn Tyr Leu His Gin Arg Lys Leu Asp Leu Leu Lys Glu Gin Lys 
430 435 440 



AGA ATT ATT ACA AAT AAT GTT TAT TCA TTT TTT GTA TAA TATAAAGCGA 
Arg He He Thr Asn Asn Val Tyr Ser Phe Phe Val * 
445 450 455 

TTTAA 

(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 457 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 

Met Lys Glu Arg Leu Lys Ala Pro Glu Leu Arg Phe Asp Gly Phe Thr 
15 10 15 

Asp Asp Trp Glu Glu Arg Lys Leu Leu Asp Asn Val Glu Lys Val Leu 
20 25 30 

His Tyr Arg Gly Lys Ser Pro Ala Lys Phe Gly Met Glu Trp Gly Thr 
35 40 45 

Glu Gly Tyr Leu Val Leu Ser Ala Leu Asn Val Lys Asn Gly Tyr He 
50 55 60 

Asp Lys Ser Val Glu Ala Lys Tyr Gly Asp His Glu Leu Phe Asp Arg 
65 70 75 80 

Trp Met Gly Asn Asn Arg Leu Glu Lys Gly Asp Val Val Phe Thr Thr 
85 90 95 

Glu Ala Pro Leu Gly Asn Val Ala Gin Val Pro Asp Asn Asn Gly Tyr 
100 105 110 

He Leu Asn Gin Arg Ala Val Ala Phe Lys Ser Leu Gin Glu Thr Asp 
115 120 125 



Asp Asn Phe Phe Ala Gin Leu Leu Arg Ser Pro He Val Gin Asn Thr 
130 135 140 

Leu Lys Ala Ser Ser Ser Gly Gly Thr Ala Lys Gly He Gly Met Lys 
145 150 155 160 

Glu Phe Ala Lys Leu Asn Ala Arg Val Pro Glu Thr His Glu Glu Gin 
165 170 175 

Arg Lys He Gly Leu Phe Phe Lys Gin Leu Asp Asp Thr He Val Leu 
180 185 190 
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His Gin Arg Lys Leu Asp Leu Leu Lys Glu Gin Lys Lys Gly Tyr Leu 
195 200 205 

Gin Lys Met Phe Pro Lys Asn Gly Ser Lys He Pro Glu Leu Arg Phe 
210 215 220 



Ala Glu Phe Ala Asp Asp Trp Glu Glu Arg Lys Leu Gly Glu Val Ala 
225 230 235 240 

Thr Phe Leu Asn Gly Arg Ala Tyr Lys Gin Asp Glu Leu Leu Asp Ser 
245 250 255 

Gly Lys Tyr Lys Val Leu Arg Val Gly Asn Phe Tyr Thr Asn Asp Ser 
260 265 270 

Trp Tyr Tyr Ser Asn Met Glu Leu Gly Asp Lys Tyr Tyr Val Asp Lys 
275 280 285 

Gly Asp Leu Val Tyr Thr Trp Ser Ala Thr Phe Gly Pro His He Trp 
290 295 300 

Ser Gly Glu Lys Val He Tyr His Tyr His He Trp Lys Val Glu Leu 
305 310 315 320 

Ser Lys Phe Leu Asp Arg Asn Phe Thr Leu Gin Leu Leu Glu Ala Asp 
325 330 335 

Lys Ala Arg Leu Leu Ser Ser Thr Asn Gly Ser Thr Met He His Val 
340 345 350 

Thr Lys Gly Asp Met Glu Ser Lys He Val Ser He Pro Asn He Asp 
355 360 365 

Glu Gin Lys Gin He Gly Ser Phe Phe Lys Gin Leu Asp Asn Thr He 
370 375 380 



Thr Leu His Gin Arg Lys Leu Asp Leu Leu Lys Glu Gin Lys Lys Gly 

385 390 395 400 

Phe Leu Gin Lys Met Phe His Leu Thr Asn Leu Gly Ala Phe Thr Met 

405 410 415 



Glu Thr He Gin Lys Tyr Leu Lys 
420 

His Gin Arg Lys Leu Asp Leu Leu 
435 440 



He He Val Glu Ser Asn Tyr Leu 
425 430 

Lys Glu Gin Lys Arg He He Thr 
445 



Asn Asn Val Tyr Ser Phe Phe Val * 
450 455 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

<i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1308 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 
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(ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT : 44 1258 

(D) AUTRE S INFORMATIONS: /products "HsdS" 
(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 



GCCTTGATTG AATCGATGCG TCTTCTTTTG AGAGGCGGTC ATG ATG AGT AAA AAG 55 

Met Met Ser Lys Lys 
1 5 

AGT CCA CAA TTA AGG TTT GAA GGT TTT ACG GAT GAT TGG GAA GAA CGT 103 
Ser Pro Gin Leu Arg Phe Glu Gly Phe Thr Asp Asp Trp Glu Glu Arg 
10 15 20 

AAG TTT GGA GAA GTT TGG AAA AAA TCA AGT GAG CGC AAT TTA AAT TTA 151 
Lys Phe Gly Glu Val Trp Lys Lys Ser Ser Glu Arg Asn Leu Asn Leu 
25 30 35 

GAA TAT TCA CCG AAG CAA GTT TTA TCA GTG GCT CAA ATG AAA TTA AAT 199 
Glu Tyr Ser Pro Lys Gin Val Leu Ser Val Ala Gin Met Lys Leu Asn 
40 45 50 

CCA TCT AAT AGA AAT GAA CAG GAT GAT TAT ATG AAA ACA TAT AAT GTG 247 
Pro Ser Asn Arg Asn Glu Gin Asp Asp Tyr Met Lys Thr Tyr Asn Val 
55 60 65 

CTT CAT AAA GGT GAT ATT GCA TTT GAA GGT AAC AAG TCA AAG AGT TTT 295 
Leu His Lys Gly Asp lie Ala Phe Glu Gly Asn Lys Ser Lys Ser Phe 
70 75 80 85 

GCA TTT GGT AGG TTT GTT CTA GAT GAT TTA CAG GAT GGG ATA GTC TCG 343 
Ala Phe Gly Arg Phe Val Leu Asp Asp Leu Gin Asp Gly lie Val Ser 
90 95 100 

CAT GTA TTT TAT GTA TAT CGC CCT ATT TGT AAA ATG GAT ACA GAT TTT 3 91 

His Val Phe Tyr Val Tyr Arg Pro lie Cys Lys Met Asp Thr Asp Phe 
105 110 115 

ATG ATA GTT TAT ATA AAT AAT GAA TCT GTA ATG AAG TAT CTT TTA GTT 439 
Met lie Val Tyr lie Asn Asn Glu Ser Val Met Lys Tyr Leu Leu Val 
120 125 130 

" AAG' GCA~ACT ACT" AAA ~ACT~TTG "ATG" ATG ACT" ACT TTA AAT ACT "AAA GAT 1187" 
Lys Ala Thr Thr Lys Thr Leu Met Met Thr Thr Leu Asn Thr Lys Asp 
135 140 145 

ATT GTT AAA CCA AAA CTA AAC TTA CCT AGT CTT GAA GAA CAA CAA AAG 535 
lie Val Lys Pro Lys Leu Asn Leu Pro Ser Leu Glu Glu Gin Gin Lys 
150 155 160 165 

ATC GGT TCA TTC TTC AAA CAG TTA GAT GCC ACT ATC GCT CTT CAT CAA 583 
lie Gly Ser Phe Phe Lys Gin Leu Asp Ala Thr He Ala Leu His Gin 
170 175 180 

CGT AAG CTA GAT TTG TTG AAA GAA CAG AAA AAA GGC TAC TTC CAA AAA 631 
Arg Lys Leu Asp Leu Leu Lys Glu Gin Lys Lys Gly Tyr Phe Gin Lys 
185 190 195 
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ATG TTC CCT AAA AAT GGT GCC AAA GTT CCT GAA TTG CGA TTT GCG GGG 679 

Met Phe Pro Lys Asn Gly Ala Lys Val Pro Glu Leu Arg Phe Ala Gly 

200 205 210 

TTT GCT GAC GAT TGG GAA GAT CGT AAG TTA GGT GAA TTA GCT AGT TTT 727 

Phe Ala Asp Asp Trp Glu Asp Arg Lys Leu Gly Glu Leu Ala Ser Phe 

215 220 225 

TCA AAA GGC AAT GGA TAT ACA AAA AAT GAT TTA GTC GAA TTT GGA GAT 775 

Ser Lys Gly Asn Gly Tyr Thr Lys Asn Asp Leu Val Glu Phe Gly Asp 
230 235 240 245 



CCA ATA ATT TTA TAT GGT CGC TTA TAT ACA AAA TAT GAA ACA GTT ATT 823 
Pro lie lie Leu Tyr Gly Arg Leu Tyr Thr Lys Tyr Glu Thr Val lie 
250 255 260 



GAG AAA GTA GAT ACA TTT GTA AAT AAG AAA GAT AAA TCA ATA ATT AGT 871 
Glu Lys Val Asp Thr Phe Val Asn Lys Lys Asp Lys Ser lie He Ser 
265 270 275 



GGA GGA TCT GAA GTC ATA GTG CCT GCA TCA GGA GAA TCT TCA GAA GAT 919 
Gly Gly Ser Glu Val lie Val Pro Ala Ser Gly Glu Ser Ser Glu Asp 
280 285 290 



ATT TCT AGA GCT TCA GTT GTT GGG AAA TCA GGT ATA ATT TTA GGC GGA 967 
He Ser Arg Ala Ser Val Val Gly Lys Ser Gly He He Leu Gly Gly 
295 300 305 



GAT TTA AAT ATA ATT AAA CCA GTA AAT TAT ATT GAT TCT ATT TTT TTA 1015 

Asp Leu Asn He He Lys Pro Val Asn Tyr He Asp Ser He Phe Leu 

310 315 320 325 

GCT TTA ACT ATT TCT AAT GGA TCT CAA CAA AAA GAA ATG TCT AAG AGA 1063 

Ala Leu Thr He Ser Asn Gly Ser Gin Gin Lys Glu Met Ser Lys Arg 

330 335 340 

• GCT CAA GGA AAA TCT GTA GTT CAT CTG CAT AAC TCT GAT CTA AAA CAA 1111 

Ala Gin Gly Lys Ser Val Val His Leu His Asn Ser Asp Leu Lys Gin 

345 350 355 

GTA AAT ATT TTA TAT CCA AAA TTA GGA GAA CAA CAA AAA ATC GGT TCA 1159 

Val Asn He Leu Tyr Pro Lys Leu Gly Glu Gin Gin Lys He Gly Ser 

360 365 370 

TTC TTC AAA CAA CTA GAT AAC ACT ATC GTT CTT CAT CAA CGT AAG TTA 1207 

Phe Phe Lys Gin Leu Asp Asn Thr He Val Leu His Gin Arg Lys Leu 

375 380 385 

GAT TTT TTG AAA GAG CAG AAA AAA GGC TTT TTA CAA AAG ATG TTT GTT 1255 

Asp Phe Leu Lys Glu Gin Lys Lys Gly Phe Leu Gin Lys Met Phe Val 

390 395 400 405 

TAG GGTCTATAAT TAGATAATAA CCCCTCACAA ATCCCATTAA AAT AGCC CCT 1308 

(2) INFORMATIONS POUR LA SEQ ID NO: 12: 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 406 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

Met Met Ser Lys Lys Ser Pro Gin Leu Arg Phe Glu Gly Phe Thr Asp 
15 10 15 

Asp Trp Glu Glu Arg Lys Phe Gly Glu Val Trp Lys Lys Ser Ser Glu 
20 25 30 

Arg Asn Leu Asn Leu Glu Tyr Ser Pro Lys Gin Val Leu Ser Val Ala 
35 40 45 

Gin Met Lys Leu Asn Pro Ser Asn Arg Asn Glu Gin Asp Asp Tyr Met 
50 55 60 

Lys Thr Tyr Asn Val Leu His Lys Gly Asp lie Ala Phe Glu Gly Asn 
65 70 75 80 

Lys Ser Lys Ser Phe Ala Phe Gly Arg Phe Val Leu Asp Asp Leu Gin 
85 90 95 

Asp Gly lie Val Ser His Val Phe Tyr Val Tyr Arg Pro lie Cys Lys 
100 105 110 

Met Asp Thr Asp Phe Met lie Val Tyr lie Asn Asn Glu Ser Val Met 
115 120 125 

Lys Tyr Leu Leu Val Lya Ala Thr Thr Lys Thr Leu Met Met Thr Thr 
130 135 140 

Leu Asn Thr Lys Asp lie Val Lys Pro Lys Leu Asn Leu Pro Ser Leu 
145 150 155 160 

Glu Glu Gin Gin Lys lie Gly Ser Phe Phe Lys Gin Leu Asp Ala Thr 
165 170 175 

lie Ala Leu His Gin Axg Lys Leu Asp Leu Leu Lys Glu Gin Lys Lys 
180 185 190 



Gly Tyr Phe Gin Lys Met Phe Pro Lys Asn Gly Ala Lys Val Pro Glu 
195 200 205 

Leu Arg Phe Ala Gly Phe Ala Asp Asp Trp Glu Asp Arg Lys Leu Gly 
210 215 220 

Glu Leu Ala Ser Phe Ser Lys Gly Asn Gly Tyr Thr Lys Asn Asp Leu 
225 230 235 240 

Val Glu Phe Gly Asp Pro lie lie Leu Tyr Gly Arg Leu Tyr Thr Lys 
245 250 255 

Tyr Glu Thr Val lie Glu Lys Val Asp Thr Phe Val Asn Lys Lys Asp 
260 265 270 
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Lys Ser He He Ser Gly Gly Ser Glu Val He Val Pro Ala Ser Gly 
275 280 285 

Glu Ser Ser Glu Asp He Ser Arg Ala Ser Val Val Gly Lys Ser Gly 
290 295 300 

He He Leu Gly Gly Asp Leu Asn He He Lys Pro Val Asn Tyr He 
305 310 315 320 

Asp Ser He Phe Leu Ala Leu Thr He Ser Asn Gly Ser Gin Gin Lys 
325 330 335 

Glu Met Ser Lys Arg Ala Gin Gly Lys Ser Val Val His Leu His Asn 
340 345 350 

Ser Asp Leu Lys Gin Val Asn He Leu Tyr Pro Lys Leu Gly Glu Gin 
355 360 365 

Gin Lys He Gly Ser Phe Phe Lys Gin Leu Asp Asn Thr He Val Leu 
370 375 380 

His Gin Arg Lys Leu Asp Phe Leu Lys Glu Gin Lys Lys Gly Phe Leu 
385 390 395 400 

Gin Lys Met Phe Val * 
405 

(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1300 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 11. .12 88 

(D) AUTRE S INFORMATIONS : /product = "HsdS" 
<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 



GGTGGGGACT ATG GCG AAA ATA GAT GAT TCA GTT AAA AAG AGA GTT CCA 49 
Met Ala Lys He Asp Asp Ser Val Lys Lys Arg Val Pro 
15 10 

GAA TTA AGG TTT CCG GGA TTT ACG AAT GAT TGG GAA GAG CGT AAG TTT 97 
Glu Leu Arg Phe Pro Gly Phe Thr Asn Asp Trp Glu Glu Arg Lys Phe 
15 20 25 

TTT GAA AGT ATA GCT TCA ACA ATA GAT TTT AGA GGT AGA ACT CCT AAA 145 
Phe Glu Ser He Ala Ser Thr He Asp Phe Arg Gly Arg Thr Pro Lys 
30 35 40 45 

AAG TTA GGC ATG GAC TGG AGT GAT TCT GGA TAT TTA GCT TTA TCC GCT 193 
Lys Leu Gly Met Asp Trp Ser Asp Ser Gly Tyr Leu Ala Leu Ser Ala 
50 55 60 
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TTG AAC GTA AAA AAT GGA TAT ATT GAT CCG TTA GCT GAT GCT CAC TAT 241 
Leu Asn Val Lys Asn Gly Tyr lie Asp Pro Leu Ala Asp Ala His Tyr 
65 70 75 

GGT GAT GAG AAA TTA TAC AGA AAA TGG ATG TCA GGA AGA GAA CTA AAA 289 
Gly Asp Glu Lys Leu Tyr Arg Lys Trp Met Ser Gly Arg Glu Leu Lys 
80 85 90 

AAA GGA CAG GTT CTC TTT ACA ACA GAG GCT CCT ATG GGA AAT GTC GCT 337 
Lys Gly Gin Val Leu Phe Thr Thr Glu Ala Pro Met Gly Asn Val Ala 
95 100 105 

CAA GTA CCT GAT GAT AAC GGA TAT ATT TTA AGT CAA AGA ACT GTA GCA 385 
Gin Val Pro Asp Asp Asn Gly Tyr He Leu Ser Gin Arg Thr Val Ala 
110 115 120 125 

TTT GAG ACC AAA GAA GAT ATG ATG ACT AAT GAC TTC TTA GCT GTA TTA 433 
Phe Glu Thr Lys Glu Asp Met Met Thr Asn Asp Phe Leu Ala Val Leu 
130 135 140 

TTA AAA TCT CCT TTA GTT TTC AAT AAT TTA TCA GCA TTA TCA AGC GGT 481 
Leu Lys Ser Pro Leu Val Phe Asn Asn Leu Ser Ala Leu Ser Ser Gly 
145 150 155 

GGA ACT GCT AAA GGG GTT AGT CAA AAA TCA TTA AAA GGA CTA TCT ATA 529 
Gly Thr Ala Lys Gly Val Ser Gin Lys Ser Leu Lys Gly Leu Ser He 
160 165 170 

ACT GTC CCA TTG GAT ATT GAC GAG CAA CAA AAA ATC GGT TCA TTC TTC 577 
Thr Val Pro Leu Asp He Asp Glu Gin Gin Lys He Gly Ser Phe Phe 
175 180 185 

AAA CAT TTA GAT GAC ACT ATC GCT CTT CAT CAA CGT AAG TTG GAT TTA 625 
Lys His Leu Asp Asp Thr He Ala Leu His Gin Arg Lys Leu Asp Leu 
190 195 200 205 

- CTC AAG GAA CAG AAA AAA GGC TAC TTG CAA AAA ATG TTC CCT AAA AAT 673 
Leu Lys Glu Gin Lys Lys Gly Tyr Leu Gin Lys Met Phe Pro Lys Asn 
210 215 220 

GGT GCC AAA GTT CCT GAA TTG CGA TTT GCG GGG TTT GCT GAC GAT TGG 721 
Gly Ala Lys Val Pro Glu Leu Arg Phe Ala Gly Phe Ala Asp Asp Trp 

225 23 0 235- 

GAA GAG CGT AAG TTG GGT GAT ATA GCT CCC TTA CGT GGC GGT TAT GCA 769 
Glu Glu Arg Lys Leu Gly Asp He Ala Pro Leu Arg Gly Gly Tyr Ala 
240 245 250 

TTC AAA AGC TCT AAA TTC AGG AAA ACT GGT GTG CCA ATT GTT AGA ATT 817 
Phe Lys Ser Ser Lys Phe Arg Lys Thr Gly Val Pro He Val Arg He 
255 260 265 

TCA AAT ATT CTT TCC AGC GGG GAG GTA GGT GGA GAT TTT GCA TAT TAT 865 
Ser Asn He Leu Ser Ser Gly Glu Val Gly Gly Asp Phe Ala Tyr Tyr 
270 275 280 285 
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GAT GAA CAG GAT AAG GAT GAC AAA TAT ATT CTT CCA GAT AAA TCA GCA 
Asp Glu Gin Asp Lys Asp Asp Lys Tyr He Leu Pro Asp Lys Ser Ala 
290 295 300 



913 



GTC CTA GCC ATG TCA GGT GCA ACA ACA GGT AAG GTA TCT ATA CTA TCT 
Val Leu Ala Met Ser Gly Ala Thr Thr Gly Lys Val Ser He Leu Ser 
305 310 315 



961 



CAA ACT GAT TAT GAC AAG GTC TAT CAA AAC CAG CGA GTT GGT TAT TTT 1009 
Gin Thr Asp Tyr Asp Lys Val Tyr Gin Asn Gin Arg Val Gly Tyr Phe 
320 325 330 

CAG TCT GTA GAC TAT ATT GAC TAC GGG TTT ATT TCC ACA ATC GTC CGT 1057 
Gin Ser Val Asp Tyr He Asp Tyr Gly Phe He Ser Thr He Val Arg 
335 340 345 

TCA GAA TTA TTC ATG ATG CAA CTT GAG TCT GTT CTA GTT TCA GGC GCT 1105 
Ser Glu Leu Phe Met Met Gin Leu Glu Ser Val Leu Val Ser Gly Ala 
350 355 360 365 

CAG CCA AAT GTA TCG TCA AAA GAA ATT GAT TCG TTT AAT TTT ATG ATT 1153 
Gin Pro Asn Val Ser Ser Lys Glu He Asp Ser Phe Asn Phe Met He 
370 375 380 



CCC ATA TTA GTT CAG GAG CAA CAA AAA ATC GGT TCA TTC TTC AAA CAG 
Pro He Leu Val Gin Glu Gin Gin Lys He Gly Ser Phe Phe Lys Gin 
385 390 395 



12 01 



TTA GAT GAC ACT ATC GCT CTT CAT CAA CGT AAG CTA GAT TTG TTG AAA 
Leu Asp Asp Thr He Ala Leu His Gin Arg Lys Leu Asp Leu Leu Lys 
400 405 410 



1249 



GAA CAG AAA AAA GGC TTT TTA CAA AAG ATG TTT GTT TAG GGTCTATAAT 
Glu Gin Lys Lys Gly Phe Leu Gin Lys Met Phe Val * 
415 420 425 



1298 



TA 



1300 



(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4 26 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 

Met Ala Lys He Asp Asp Ser Val Lys Lys Arg Val Pro Glu Leu Arg 
15 10 15 

Phe Pro Gly Phe Thr Asn Asp Trp Glu Glu Arg Lys Phe Phe Glu Ser 
20 25 30 

He Ala Ser Thr He Asp Phe Arg Gly Arg Thr Pro Lys Lys Leu Gly 
35 40 45 
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Met Asp Trp Ser Asp Ser Gly Tyr Leu Ala Leu Ser Ala Leu Asn Val 
50 55 60 

Lys Asn Gly Tyr He Asp Pro Leu Ala Asp Ala His Tyr Gly Asp Glu 
65 70 75 80 

Lys Leu Tyr Arg Lys Trp Met Ser Gly Arg Glu Leu Lys Lys Gly Gin 
85 90 95 

Val Leu Phe Thr Thr Glu Ala Pro Met Gly Asn Val Ala Gin Val Pro 
100 105 HO 

Asp Asp Asn Gly Tyr He Leu Ser Gin Arg Thr Val Ala Phe Glu Thr 
115 120 125 

Lys Glu Asp Met Met Thr Asn Asp Phe Leu Ala Val Leu Leu Lys Ser 
130 135 140 

Pro Leu Val Phe Asn Asn Leu Ser Ala Leu Ser Ser Gly Gly Thr Ala 
145 150 155 160 

Lys Gly Val Ser Gin Lys Ser Leu Lys Gly Leu Ser He Thr Val Pro 
165 170 175 

Leu Asp lie Asp Glu Gin Gin Lys He Gly Ser Phe Phe Lys His Leu 
180 185 190 

Asp Asp Thr He Ala Leu His Gin Arg Lys Leu Asp Leu Leu Lys Glu 
195 200 205 

Gin Lys Lys Gly Tyr Leu Gin Lys Met Phe Pro Lys Asn Gly Ala Lys 
210 215 220 

Val Pro Glu Leu Arg Phe Ala Gly Phe Ala Asp Asp Trp Glu Glu Arg 
225 230 235 240 

Lys Leu Gly Asp lie Ala Pro Leu Arg Gly Gly Tyr Ala Phe Lys Ser 
245 250 255 

Ser Lys Phe Arg Lys Thr Gly Val Pro He Val Arg He Ser Asn He 
260 265 270 

Leu Ser Ser Gly Glu Val Gly Gly Asp Phe Ala Tyr Tyr Asp Glu Gin 

275 280 — 285 

Asp Lys Asp Asp Lys Tyr He Leu Pro Asp Lys Ser Ala Val Leu Ala 
290 295 300 

Met Ser Gly Ala Thr Thr Gly Lys Val Ser He Leu Ser Gin Thr Asp 
305 310 315 320 

Tyr Asp Lys Val Tyr Gin Asn Gin Arg Val Gly Tyr Phe Gin Ser Val 
325 330 335 

Asp Tyr He Asp Tyr Gly Phe He Ser Thr He Val Arg Ser Glu Leu 
340 345 350 



BNSDOCID: <FR 2767831 A 1J_> 



2767831 

55 

Phe Met Met Gin Leu Glu Ser Val Leu Val Ser Gly Ala Gin Pro Asn 
355 360 365 



Val Ser Ser Lys Glu He Asp Ser Phe Asn Phe Met He Pro He Leu 
370 375 380 

Val Gin Glu Gin Gin Lys He Gly Ser Phe Phe Lys Gin Leu Asp Asp 
385 390 395 400 

Thr He Ala Leu His Gin Arg Lys Leu Asp Leu Leu Lys Glu Gin Lys 
405 410 415 



Lys Gly Phe Leu Gin Lys Met Phe Val * 
420 425 

(2) INFORMATIONS POUR LA SEQ ID NO: 15: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1250 paires de bases 
<B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : double 

(D) CONFIGURATION: lineaire 



(ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 4 6. .1233 

<D) AUTRE S INFORMATIONS: /product= "HsdS" 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 



AAAAAGGATA GAAGAACAAG AAAAACCAAG AAAGTGGTGG GGACT ATG GCG AAA 54 

Met Ala Lys 
1 

ATA GAT GAT TCA GTT AAA AAG AAA GTT CCT GAA TTG CGA TTT AAA GGA 102 
He Asp Asp Ser Val Lys Lys Lys Val Pro Glu Leu Arg Phe Lys Gly 
5 10 15 

TTT ACG AAT GAT TGG GAA GAG CGT AAG TTA GGA GAA TTA TCT AAT ATT 150 
Phe Thr Asn Asp Trp Glu Glu Arg Lys Leu Gly Glu Leu Ser Asn He 
20 25 30 35 

GTT GGT GGT GGA ACA CCA AGT ACA TCG AAC CCT GAA TAC TGG GAC GGT 198 
Val Gly Gly Gly Thr Pro Ser Thr Ser Asn Pro Glu Tyr Trp Asp Gly 
40 45 * 50 

GAT ATT GAT TGG TAT GCA CCA GCT GAA ATT GGA GAA CAA AGT TAT GTT 246 
Asp He Asp Trp Tyr Ala Pro Ala Glu He Gly Glu Gin Ser Tyr Val 
55 60 65 

AGC AAA AGT AAA AAG ACT ATT ACT GAA CTA GGT CTA AAG AAG AGT TCA 294 
Ser Lys Ser Lys Lys Thr He Thr Glu Leu Gly Leu Lys Lys Ser Ser 
70 75 80 

GCT CGA ATT TTA CCA GTA GGA ACC GTC TTA TTT ACT TCT CGT GCT GGT 342 
Ala Arg He Leu Pro Val Gly Thr Val Leu Phe Thr Ser Arg Ala Gly 
85 90 95 
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ATC GGA AAC ACC GCT ATA TTA GCC AAA GAA GCT ACA ACT AAT CAA GGG 3 90 

lie Gly Asn Thr Ala lie Leu Ala Lys Glu Ala Thr Thr Asn Gin Gly 
100 105 110 115 

TTT CAA TCA ATT GTT CCT GAT CAA AAT AAA CTT GAT AGT TAT TTT ATT 438 
Phe Gin Ser He Val Pro Asp Gin Asn Lys Leu Asp Ser Tyr Phe He 
120 125 130 

TTT TCA AGA ACT AAT GAG CTC AAG CGA TAT GGG GAA GTC ACT GGT GCA 486 
Phe Ser Arg Thr Asn Glu Leu Lys Arg Tyr Gly Glu Val Thr Gly Ala 
135 140 145 

GGA TCT ACT TTT GTT GAG GTT TCA GGT AAG CAA ATG TCG AAA ATG TCG 534 
Gly Ser Thr Phe Val Glu Val Ser Gly Lys Gin Met Ser Lys Met Ser 
150 155 160 

ATT ATG GTA CCT GAA CTT TCA GAA CAA CAA AAA ATT GGT AAC TTC TTT 582 
He Met Val Pro Glu Leu Ser Glu Gin Gin Lys He Gly Asn Phe Phe 
165 170 175 

AAA GAG TTA GAC AAC ACT ATC GCT CTT CAT CAG CGT AAG TTA GAT TTG 630 
Lys Glu Leu Asp Asn Thr He Ala Leu His Gin Arg Lys Leu Asp Leu 
180 185 190 195 

TTG AAA GAA CAG AAA AAA GGC TAC TTG CAA AAA ATG TTC CCT AAA AAT 678 
Leu Lys Glu Gin Lys Lys Gly Tyr Leu Gin Lys Met Phe Pro Lys Asn 
200 205 210 

GGT GCC AAA GTT CCT GAA TTG CGA TTT GCG GGG TTT GCT GAC GAT TGG 726 
Gly Ala Lys Val Pro Glu Leu Arg Phe Ala Gly Phe Ala Asp Asp Trp 
215 220 225 

GAA GAG CGT AAG TTA GGA GAT ATT ACT AAA ATA AGC ACC GGA AAA TTA 774 
Glu Glu Arg Lys Leu Gly Asp He Thr Lys He Ser Thr Gly Lys Leu 
230 235 240 

GAT GCA AAT GCA ATG GTT GAA AAT GGC AAG TAT GAT TTT TAT ACT TCT 822 
• Asp Ala Asn Ala Met Val Glu Asn Gly Lys Tyr Asp Phe Tyr Thr Ser 
245 250 255 

GGA ATT AAA AAA TAT AGG ATC GAT GTA GCA GCG TTT GAA GGA CCG TCC 870 
Gly He Lys Lys Tyr Arg He Asp Val Ala Ala Phe Glu Gly Pro Ser 
260 265 270 275 

ATT ACA ATT GCA GGT AAT GGA GCA ACA GTT GGA TAC ATG CAT TTA GCG 918 
He Thr He Ala Gly Asn Gly Ala Thr Val Gly Tyr Met His Leu Ala 
280 285 290 

GAT AAT AAG TTC AAT GCC TAT CAA CGA ACT TAT GTG CTC CAA GAG TTT 966 
Asp Asn Lys Phe Asn Ala Tyr Gin Arg Thr Tyr Val Leu Gin Glu Phe 
295 300 305 

CTA GTA GAT AGA AGT TTT ATA TTT TCA GAA ATT GGA AAT AAG CTG CCT 1014 
Leu Val Asp Arg Ser Phe He Phe Ser Glu He Gly Asn Lys Leu Pro 
310 315 320 
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AAA AAA ATA AAA CAG GAA GCT CGT ACA GGA AAT ATT CCG TAC ATT GTT 1062 
Lys Lys He Lys Gin Glu Ala Arg Thr Gly Asn He Pro Tyr He Val 
325 330 335 

ATG GAC ATG TTG ACT GAA CTG AAG CTA TCG ATT CCT CAG AAT AAT TCA 1110 
Met Asp Met Leu Thr Glu Leu Lys Leu Ser He Pro Gin Asn Asn Ser 
340 345 350 355 

GAG CAA CAA AAA ATA GGT TCA TTC TTT AAA CAG CTA GAT GAC ACT ATC 1158 
Glu Gin Gin Lys He Gly Ser Phe Phe Lys Gin Leu Asp Asp Thr He 
360 365 370 

GCT CTT CAT CAA CGT AAG TTA GCA TTT GTT GAA AGA ACA GAA AAC ACA 1206 
Ala Leu His Gin Arg Lys Leu Ala Phe Val Glu Arg Thr Glu Asn Thr 
375 380 385 

GGC TTT TTA CAA AAG ATG TTT GTT TAG GGTCTATAAT TAGATAA 1250 
Gly Phe Leu Gin Lys Met Phe Val * 
390 395 

(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 396 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 

Met Ala Lys He Asp Asp Ser Val Lys Lys Lys Val Pro Glu Leu Arg 
15 10 15 

Phe Lys Gly Phe Thr Asn Asp Trp Glu Glu Arg Lys Leu Gly Glu Leu 
20 25 30 

Ser Asn lie Val Gly Gly Gly Thr Pro Ser Thr Ser Asn Pro Glu Tyr 
35 40 45 

Trp Asp Gly Asp He Asp Trp Tyr Ala Pro Ala Glu He Gly Glu Gin 
50 55 60 

Ser Tyr Val Ser Lys Ser Lys Lys Thr He Thr Glu Leu Gly Leu Lys 
65 70 75 80 

Lys Ser Ser Ala Arg He Leu Pro Val Gly Thr Val Leu Phe Thr Ser 
85 90 95 

Arg Ala Gly He Gly Asn Thr Ala He Leu Ala Lys Glu Ala Thr Thr 
100 105 110 

Asn Gin Gly Phe Gin Ser He Val Pro Asp Gin Asn Lys Leu Asp Ser 
115 120 125 

Tyr Phe lie Phe Ser Arg Thr Asn Glu Leu Lys Arg Tyr Gly Glu Val 
130 135 140 
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Thr Gly Ala Gly Ser Thr Phe Val Glu Val Ser Gly Lys Gin Met Ser 
145 150 155 160 

Lys Met Ser He Met Val Pro Glu Leu Ser Glu Gin Gin Lys He Gly 
165 170 175 

Asn Phe Phe Lys Glu Leu Asp Asn Thr He Ala Leu His Gin Arg Lys 
180 185 190 

Leu Asp Leu Leu Lys Glu Gin Lys Lys Gly Tyr Leu Gin Lys Met Phe 
195 200 205 

Pro Lys Asn Gly Ala Lys Val Pro Glu Leu Arg Phe Ala Gly Phe Ala 
210 215 220 

Asp Asp Trp Glu Glu Arg Lys Leu Gly Asp He Thr Lys He Ser Thr 
225 230 235 240 

Gly Lys Leu Asp Ala Asn Ala Met Val Glu Asn Gly Lys Tyr Asp Phe 
245 250 255 

Tyr Thr Ser Gly He Lys Lys Tyr Arg He Asp Val Ala Ala Phe Glu 
260 265 270 

Gly Pro Ser He Thr He Ala Gly Asn Gly Ala Thr Val Gly Tyr Met 
275 280 285 

His Leu Ala Asp Asn Lys Phe Asn Ala Tyr Gin Arg Thr Tyr Val Leu 
290 295 300 

Gin Glu Phe Leu Val Asp Arg Ser Phe He Phe Ser Glu He Gly Asn 
305 310 315 320 

Lys Leu Pro Lys Lys He Lys Gin Glu Ala Arg Thr Gly Asn He Pro 
325 330 335 

Tyr He Val Met Asp Met Leu Thr Glu Leu Lys Leu Ser He Pro Gin 
340 345 350 

Asn Asn Ser Glu Gin Gin Lys He Gly Ser Phe Phe Lys Gin Leu Asp 
355 360 365 

Asp Thr He Ala Leu His Gin Arg Lys Leu Ala Phe Val Glu Arg Thr 

-3-70 375 380 ~ 

Glu Asn Thr Gly Phe Leu Gin Lys Met Phe Val * 
385 390 395 
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REVENDICATIONS 

1) Polypeptide, constituant 1'une des sous- 
unites HsdR, HsdM, ou HsdS d'un mecanisme de resistance 
aux bacteriophages R/M de type Ic, caracterise en ce que 
ledit mecanisme est actif contre les phages des bacteries 
lactiques. 

2) Polypeptide selon la revendication 1, 
caracterise en ce qu' il est choisi dans le groupe 
constitue par : 

- les polypeptides constituant une sous-unite 
HsdR comprenant la sequence (I) suivante : 

KRliARK 

- les polypeptides constituant une sous-unite 
HsdM comprenant au moins l'une des sequences suivantes : 

- la sequence (II) : 

GLX^FYKYLS 

dans laquelle represent e I ou L, 

- la sequence (III) : 

ENDX 2 NLN I PR YVDTFEEEE 

dans laquelle X 2 represente Y ou F 

- les polypeptides constituant une sous-unite 
HsdS comprenant : 

* un domaine N-terminal d' environ 150 a 180 
acides amines, comprenant la sequence (IV) suivante : 

PX 3 LRFX4GFTX5DDWEERKX5 

dans laquelle X 3 represente E ou Q, X 4 
represente E, P, D, ou K, X 5 represente N ou D, X 6 
represente L ou F ; 

* un domaine central, d' environ 50 a 80 acides 
amines, comprenant la sequence (V) suivante : 

H^ 7 KI(^FFKX 9 IiK 10 ra 

dans laquelle X 7 represente R ou Q, X3 
represente S, N, ou L, X 9 represente E, H, ou Q, X 10 
represente A, D, ou N, X X1 represente A, ou V, X 12 
represente L ou F, X 13 represente A ou S, X 14 represente I 
ou V, X 15 represente E ou G, X 16 represente D ou E ; 
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* un domaine Oterminal, d' environ 160 a 200 
acides amines, comprenant la sequence (VI) suivante : 

EQX 15 X 16 IGSFFKQLDX 17 TIX 18 LHQRKLX 19 

dans laquelle X 15 represente K ou Q, 
5 represente K ou Q, X17 represente N ou D, X 18 represente 
T, A, ou V, X]_9 represente A, ou D ; 

et/ou la sequence (VII ) suivante : 
gflqkmfx 20 

dans laquelle X 2 o represente V ou H. 
10 3) Polypeptide selon la revendication 2, 

caracterise en ce qu'il est choisi dans le groupe 
constitue par : 

- un polypeptide HsdR repondant a 1'une des sequences 
respectivement representees dans la liste de 

15 sequences en annexe sous les numeros SEQ ID NO: 2 et 

SEQ ID NO: 4 ; 

- un polypeptide HsdM repondant a l'une des sequences 
respectivement representees dans la liste de 
sequences en annexe sous les numeros SEQ ID NO: 6 , et 

20 SEQ ID NO: 8 ; 

- un polypeptide HsdS constitue par : 

* un domaine N-terminal d # environ 150 a 180 
acides amines dont la sequence est celle du 
domaine N-terminal de l'une quelconque des 

25 sequences representees dans la liste de 

sequences en annexe sous les numeros 
SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, 

SEQ "I D "NOTT6~- 
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* un domaine central, d' environ 50 a 80 acides 
amines, dont la sequence est celle du domaine 
central de l'une quelconque des sequences 
representees dans la liste de sequences en 
annexe sous les numeros SEQ ID NO: 10, 
SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ; 
35 * un domaine C-terminal, d' environ 160 a 200 

acides amines, dont la sequence est celle du 
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domaine C-terminal de l'une quelconque des 
sequences representees dans la liste de 
sequences en annexe sous les numeros 
SEQ ID NO: 10, SEQ ID NO:12, SEQ ID NO:14, 

5 SEQ ID NO: 16. 

4) Sequence d'acide nucleique caracterisee en 
ce qu'elle code pour un polypeptide selon une quelconque 
des revendications 1 a 3, 

5) Sequence d'acide nucleique selon la 
10 revendication 4 caracterisee en ce qu'elle est choisie 

dans le groupe constitue par : 

- les sequences hsdR SEQ ID NO:l, et SEQ ID NO: 3 ; 

- les sequences hsdM SEQ ID NO: 5, et SEQ ID NO: 7 ; 

les sequences hsdS SEQ ID NO: 9, SEQ ID NO: 11, 
15 SEQ ID NO: 13, et SEQ ID NO: 15. 

6) Fragment d'acide nucleique d' au rnoins 18 pb 
homologue ou complementaire de tout ou partie d'une 
sequence d' acide nucleique selon une quelconque des 
revendications 4 ou 5. 

20 7) Fragment d'acide nucleique selon la 

revendication 6/ choisi dans le groupe constitue par les 
oligonucleotides homologues ou complementaires d'une 
sequence codant pour au moins 6 acides amines consecutifs 
de l'un des peptides suivants ; 

2 5 TGSGKT 

KRLARK 
LLTGFDS 
FYKYLS 
LARMNL 

3 0 LPHGVLFRGAAE 

NLNI PRYVDTFEEEE 
DDWEERK 

LHQRKLDLLKEQKKGY 
QKMFPKNG 
3 5 PELRFA 
FADDWE 
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IGSFFKQLD 
GFLQKMF . 

8) Utilisation d'au moins un fragment d'acide 
nucleique selon une quelconque des revendications 6 ou 7 

5 pour selectionner des bacteries lactiques contenant une 
sequence d'acide nucleique codant pour au moins une sous- 
unite d'un mecanisme R/M de type Ic. 

9) Utilisation d'au moins un fragment d'acide 
nucleique selon une quelconque des revendications 6 ou 7 

10 pour isoler et/ou doner un acide nucleique comprenant une 
sequence selon une quelconque des revendications 4 ou 5. 

10) Utilisation d'au moins une sequence 
d'acide nucleique selon une quelconque des revendications 
4 ou 5 pour permettre 1' expression dans une bacterie 

15 lactique d'au moins un mecanisme de resistance aux 
bacteriophages . 

11) Bacterie transformee par au moins une 
sequence d'acide nucleique selon une quelconque des 
revendications 4 ou 5. 

20 12) Bacterie transformee selon la Reven- 

dication 11, caracterisee en ce qu'elle est en outre 
capable d'exprimer un mecanisme de resistance aux 
bacteriophages choisi parmi les mecanismes Abi, et les 
mecanismes R/M de type II. 
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